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内 容 提 要 








EE， 对 JVM 内 存 管理 中 的 垃圾 回收 算法 
G1GC 进行 了 详细 解读 。 全 书 分 为 “算法 篇 ”和 “实现 篇 ”两 大 部 分 : 前 一 部 




















分 主要 介绍 G1GC 的 算法 原理 ， 内 容 包 括 G1GC 的 并 发 标记 、 转 移 功 能 、 软 








实时 性 的 实现 和 分 代 G1GC 模式 ; 























后 





















































程 管理 方法 和 G1GC 的 具体 实现 。 





























部 分 聚焦 算法 篇 中 没有 详细 讲解 的 实 

















解 对 象 管理 功能 、 内 存 分 配器 的 机 制 、 线 











本 书 以 图 配 文 , 通俗 易 懂 , 既 系统 介绍 了 G1GC 的 基础 算法 , 又 贴近 现实 ， 

















剖析 了 实用 JVM 中 的 G1GC 实现 ， 同 时 还 包含 了 作者 对 G1GC 的 研究 成 果 和 


独到 见解 ， 





本 书 适合 对 所 有 JVM 和 垃圾 下 
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重要 的 是 持续 提出 问题 。 
阿尔 伯 特 ， 爱 因 斯 坦 





垃圾 回收 (Garbage Collection， 下文 简称 GC ) 这 门 技术 有 许多 谜 
团 。 很 多 程序 员 不 太 了 解 GC 程序 的 运行 原理 ， 因 此 有 时 它 也 被 称 为 
“秘技 ”或 “魔法 ”。 

拙 作 《 垃 圾 回收 的 算法 与 实现 UI (下文 简称 “GC 书 ”) 已 经 解 开 
了 这 门 秘技 的 大 部 分 谜团 。 很 多 读者 表示 解 恋 的 过 程 轻 松 愉快 。 作 为 作 
者 之 一 ， 我 感到 非常 开心 。 

这 本 书 和 “GC 书 ” 一 样 ， 全 书 由 “算法 篇 ”和 “实现 篇 ”两 大 部 
分 构成 。 

在 算法 篇 中 ， 我 们 将 探讨 OpenJDK 7 ( 即 Java 7 ) 中 引入 的 GC 算 
法 一 一 G1GC ( Garbage First Garbage Collection ) 的 原理 。G1GC 中 有 一 
个 很 大 的 谜团 ， 那 就 是 GC 暂停 处 理 的 预测 暂停 时 间 ， 本 书 将 花 上 数 十 
页 的 篇 幅 来 揭示 它 。 

关于 G1GC 的 资料 ， 具 有 代表 性 的 是 由 大 卫 … 德 特 勒 夫 斯 ( David 
Detlefs ) 等 人 所 写 的 英语 论文 四。 但 是 那 篇 论文 非常 深奥 星 深 ， 只 读 一 
遍 是 无 法 透彻 理解 的 。 

我 初次 接触 那 篇 论文 是 在 2007 年 。 当 时 我 的 英语 阅读 能 力 有 限 ， 
也 不 怎么 了 解 GC， 所 以 没 读 多 少 就 放弃 了 。3 年 后 ， 我 掌握 了 一 定 程 
度 的 GC 知识 ， 所 以 再 次 挑战 了 那 篇 论文 ， 结 果 仍 然 没 能 彻底 理解 。 在 
那 之 后 的 半年 多 里 ， 我 读 完 论文 读 源 码 ， 读 完 源 码 又 去 读 论 文 ， 如 此 反 
复 ， 终 于 彻底 理解 了 全 部 内 容 。 对 于 我 来 说 ， 理 解 G1GC 的 过 程 可 以 称 
得 上 “荆棘 之 路 ”了 。 















































J 原 句 为 The important thing is not to stop questioning。 一 一 编者 注 


iv | 前 言 


本 书 的 算法 篇 比 原始 论文 更 加 详细 地 介绍 了 G1GC 的 算法 原理 ， 对 
于 我 以 前 理解 起 来 比较 困难 的 地 方 ， 还 特意 进行 了 详细 的 说 明 ， 因 此 内 
容 要 比 原始 论文 易于 理解 。 即 使 是 不 太 了 解 GC 的 读者 ， 理 解 起 来 应 该 
也 没有 什么 问题 。 

在 实现 篇 中 ， 我 们 将 结合 实用 JVM， 聚 焦 算 法 篇 中 没有 详细 讲解 的 
实现 部 分 。 
首先 ， 我们 会 了 解 HotSpotVM。 现 在 ，HotSpotVM 实现 了 包括 G1GC 
在 内 的 5 种 GC 算法 。 不 过 这 些 算 法 并 非 凭空 而 来 ， 而 是 基于 HotSpotVM 
中 专 为 GC 算法 设计 的 框架 实现 的 。 因 此 ， 接 着 我 们 就 会 了 解 作为 框架 之 
一 的 对 象 管理 功能 。 得 益 于 对 象 管理 功能 的 接口 ， 多 种 GC 算法 之 间 的 切 
换 成 为 可 能 ， 而 且 新 GC 算法 的 添加 也 变 得 更 加 简单 。 之 后 ， 我 们 会 了 解 
对 象 的 数据 结构 和 内 存 分 配器 。 有 关 分 配器 的 讲解 会 稍微 涉及 对 操作 系统 
的 调用 。 除 此 以 外 ， 我 们 还 将 了 解 GIGC 中 用 到 的 线程 管理 方法 。 
HotSpotVM 内 部 同样 也 有 人 能够 在 GC 过 程 中 简单 地 操作 线程 的 框架 ， 各 种 
GC 算法 都 是 通过 这 个 框架 来 实现 并 行 GC 和 并 发 GC 的 。 

再 后 面 就 是 G1GC 的 具体 实现 ， 讲 解 了 G1GC 的 并 发 标记 和 转移 ， 
以 及 调度 程序 的 实现 。 这 部 分 尽量 省 略 了 算法 篇 中 已 经 详细 讲解 过 的 内 
容 ， 着 重 讲解 前 面 没有 涉及 的 内 容 。 

对 于 G1GC， 我 曾 有 过 不 少 疑 问 。 比 如 “G1GC 是 如 何 实现 精准 
GC 的 ”和 “实现 了 这 么 多 GC 不 会 导致 写 屏 障 变 慢 吗 ”， 等 等 。 因 此 我 
研究 了 G1GC 的 实现 方式 ， 并 将 得 到 的 结果 放 在 了 本 书 的 最 后 两 章 。 

本 书 的 目的 在 于 将 我 走 过 的 “荆棘 之 路 ” 变 成 更 多 人 易于 踏 上 的 坦 
途 。 和 希望 各 位 读者 轻松 愉快 地 走 过 这 条 坦途 ， 用 最 短 的 时 间 掌 握 G1GC。 
































































































































最 后 ， 我 想 借 此 机 会 对 那些 始终 相信 并 支持 我 写作 本 书 的 赞助 人 表 
示 感 谢 ， 真 的 非常 感谢 你 们 ! 


本 书 的 算法 篇 是 对 德 特 勒 夫 斯 等 人 的 G1GC 论文 的 详细 解读 ， 不 过 相 

















对 于 论文 , 理解 起 来 会 更 轻松 。 对 于 论文 内 容 和 实际 实现 了 有 出 入 的 地 方 ， 
本 书 以 实现 为 准 进行 了 适当 的 修正 ， 因 此 个 别 地 方 会 与 原始 论文 不 同 。 

此 外 , 部 分 G1GC 算法 已 经 在 美国 取得 了 专利 %, 因此 在 实现 并 公开 
G1GC 时 请 注意 不 要 侵犯 他 人 的 专利 权 。 


本 书 适合 对 所 有 JVM 和 GC 感 兴趣 的 读者 阅读 。 

本 书 是 对 “GC 书 ” 的 补充 。 只 要 读 过 “GC 书 ”， 就 应 该 能 理解 本 
书 的 内 容 。 不 过 即使 没有 读 过 ， 只 要 具备 一 些 GC 的 基础 知识 ， 阅 读本 
书 应 该 也 不 成 问题 。 具 体 来 说 ， 需 要 事先 掌握 标记 一 清除 GC、 复 制 GC 
和 增 量 GC 等 的 基础 算法 。 关 于 这 些 基 础 知识 ， 请 参考 “GC 书 ”。 

如 果 不 具备 任何 GC 相关 的 知识 ， 而 且 也 不 打算 阅读 “GC 书 ”,， 那 
么 建议 先 自 己 在 网 络 上 简单 了 解 一 下 GC。 

另外 ， 本 书 还 适合 对 实现 OpenJDK 7 的 内 存 管理 感 兴趣 的 人 阅读 。 
由 于 本 书 实现 篇 会 引用 算法 篇 中 的 内 容 ， 因 此 建议 大 家 按照 顺序 从 头 开 


台 阅 读 。 


本 书 中 的 符号 


图 中 的 箭头 


本 书 的 插图 中 会 出 现 各 种 各 样 的 箭头 。 关 于 本 书 中 主要 使 用 的 箭 
头 ， 请 参考 图 0.1。 





















































图 0.1 箭头 的 样式 





QD G1GC 在 OpenJDK 7 中 得 到 了 实现 。 源 码 可 以 从 OpenJDK 的 官网 获得 。 
@) 美国 专利 号 为 7340494。 














Vi | 前 言 


箭头 (a) 表示 引用 关系 ， 用 于 从 根 "到 对 象 的 引用 等 。 

箭头 (b) 表示 赋值 操作 和 转移 操作 ， 用 于 给 变量 赋值 、 复 制 对 象 、 
转移 对 象 等 。 它 还 可 以 在 执行 示意 图 中 用 来 表示 正在 执行 处 理 (参见 第 
ix 页 的 图 0.2 )。 

箭头 (c) 表示 时 间 的 流逝 。 


伪 代码 

为 了 帮助 读者 理解 GC 算法 ， 本 书 采用 伪 代 码 进 行 解说 。 关 于 用 到 
的 伪 代 码 ， 后 文中 会 说 明 其 表示 法 。 
命名 规则 

变量 以 及 函数 都 用 小 写字 母 表 示 ( 例 : opj )。 常 量 都 用 大 写字 母 表 


示 ( 例 : COPIED )。 另 外 ， 本 书 用 下 划 线 连接 两 个 及 两 个 以 上 的 单词 
( 例 : free list、update ptr()、HEAP SIZE )。 





























空 指针 和 真 假 值 
设 真 值 为 TRUE， 假 值 为 FALSE。 拥 有 真 假 值 的 变量 var 的 否定 为 


not Varo 


除 此 之 外 ， 本 书 用 Nu11 表示 没有 指向 任何 地 址 的 指针 。 




















本 书 采用 与 一 般 编 程 语言 相同 的 描述 方法 来 定义 函数 。 例 如 ， 我 们 
将 以 argl1、arg2 为 参数 的 函数 func () 定义 如 下 。 











:dee vel(arl rg 
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当 以 整数 100 和 200 为 实 参 调用 该 函数 时 ， 写作 func (100，200)。 


缩 进 
我 们 将 缩 进 也 算 作 语 法 的 一 部 分 。 例 如 像 下 面 这 样 ， 用 缩 进 表示 if 




















J 根 (root ) : 追踪 对 象 引用 关系 时 的 “起 点 ”。 





前 言 vll 


语句 的 作用 域 。 
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下 
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4 习 
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在 上 面 的 例子 中 ， 只 有 当 test 为 真 时 ， 才 会 执行 第 2 行 到 第 4 行 。 
第 5 行 与 test 的 值 没有 关系 ， 所 以 一 定 会 被 执行 。 我 们 把 缩 进 长 度 设 
为 两 个 空格 。 

此 外 ,全 局 变量 (所 有 函数 都 可 以 访问 的 变量 ) 的 开头 要 加 上 $ 前 
级 。 例 如 $global。 


指针 
在 GC 算法 中 ， 指 针 是 不 可 或 缺 的 。 我 们 用 星 号 (* ) 来 访问 指针 
所 引用 的 内 存 空间 。 例 如 我 们 把 指针 ptr 指向 的 对 象 表示 为 *ptr。 























我 们 可 以 用 obj .field 来 访问 对 象 obj 的 域 field。 例 如 ， 我 们 
要 想 在 对 象 girl 的 各 个 域 name、age、j opb 中 分 别 代 入 值 ， 可 按 如 下 
书写 。 

am 二 EC 


2 E 3 
3 ol ls Wbedaneey 


for 循环 


给 整数 增 量 的 时 候 ， 我 们 使 用 fo 循环 。 例 如 用 变量 sum 求 1 到 
10 的 和 ， 代 码 如 下 所 示 。 





n= 
Re 
已 sum += i 


viii | 前 言 


队列 


GC 中 经 常用 到 队列 这 种 数据 结构 。 队 列 是 先进 入 的 数据 先 取 出 ， 
即 FIFO ( First-In First-Out， 先 进 先 出 ) 式 的 数据 结构 。 

我 们 用 enqueue () 函数 给 队列 添加 数据 ， 用 dequeue () 函数 从 队 
列 中 取出 数据 ， 用 enqueue (queue， data) 向 队列 queue 中 添加 数据 
data， 用 dequeue (queue) 从 queue 取出 并 返回 数据 。 


特殊 的 函数 
除了 上 面 介绍 的 函数 之 外 ， 还 有 一 个 会 在 伪 代 人 码 中 出 现 的 特殊 函数 。 
copy_data() 是 复制 内 存 区 域 的 防 数 。 我 们 用 copy_data (ptr1,， 
ptr2， size) 把 size 个 字 节 的 数据 从 指针 ptr2 指向 的 内 存 区 域 复制 
到 ptzl 指向 的 内 存 区 域 。 这 个 函数 跟 C 语言 中 的 memcpy () 函数 用 法 
相同 。 
































并 行 GC 和 并 发 GC 


本 书 中 即将 介绍 的 G1GC 算法 组 合 使 用 了 并 行 GC (parallel GC ) 和 
并 发 GC ( concurrent GC )。 这 里 先 介绍 一 下 这 两 种 GC 的 基础 知识 ， 
便 大 家 在 阅读 正文 时 能 更 好 地 理解 它们 在 G1GC 中 是 如 何 被 使 用 的 。 

一 般 来 说 ， 以 多 线程 执行 的 GC 就 被 称 为 并 行 GC/ 并 发 GC。 简 单 
的 GC 以 单线 程 执行 为 前 提 ， 而 并 行 GC/ 并 发 GC 的 前 提 是 多 线程 执 
行 。 因 为 这 样 可 以 更 高 效 地 发 挥 多 个 处 理 器 的 性 能 ， 进 而 达到 缩短 暂停 
时 间 的 目的 。 

“并 行 ”“ 并 发 ”这 两 个 词 虽然 长 得 很 像 ， 但 是 在 GC 中 的 意思 完全 
不 同 。 

并 行 GC 会 先 暂 停 mutator' 的 运行 ， 然 后 开启 多 个 线程 并 行 地 执行 
GC (图 0.2 )。 












































QD mutator : 一 般 指 “应 用 程序 "”， 用 于 改变 ( mutate ) GC 对 象 之 间 的 引用 关系 。 
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0.2 并 行 GC 的 执行 示意 图 


暂停 mutator， 多 个 线程 并 行 执 行 GC。 























而 并 发 GC 是 在 不 暂停 mutator 运行 的 同时 ， 直 接 开启 GC 线程 ， 
并 发 地 执行 GC ( 图 0.3 )。 











mutator RS 


GE OO 
0.3 并 发 GC 的 执行 示意 图 
不 暂停 mutator，GC 线程 和 mutator 并 发 执行 。 


并 行 GC 的 目标 是 尽量 缩短 mutator 的 暂停 时 间 ， 而 并 发 GC 的 目 
标 是 消除 mutator 的 暂停 时 间 。 

需要 注意 的 是 ， 因 为 并 发 GC 是 和 mutator 并 发 执行 的 ， 所 以 在 标 
记 存 活 对 象 的 过 程 中 ， 对 象 的 引用 关系 可 能 会 被 mutator 改变 。GC 线程 
需要 知道 到 这 种 引用 关系 的 变化 ， 于 是 并 发 GC 采用 了 增 量 式 GC 中 也 
有 的 写 屏障 ”技术 。 

并 行 GC 虽然 需要 暂停 mutator， 但 算法 实现 起 来 比较 简单 ; 并 发 
GC 不 需要 暂停 mutator， 算 法 的 实现 却 比 较 复 杂 。 

男 外 ， 并 行 GC 和 并 发 GC 可 以 配合 起 来 使 用 。 本 书 中 即将 介绍 的 
G1GC 正 是 如 此 。 在 G1GC 中 ， 大 多 数 时 候 GC 线程 和 mutator 会 并 发 
地 执行 GC， 但 是 在 个 别 阶段 的 处 理 中 ， 出 于 算法 的 考虑 则 需要 暂停 
mutator。 这 时 ，G1GC 就 会 启动 多 个 线程 ， 通 过 并 行 处 理 来 缩短 mutator 
的 暂停 时 间 。 













































































@ 写 屏障 : 一 种 处 理 技术 ， 用 于 记录 由 mutator 改变 的 对 象 之 间 的 引用 关系 。 


x | 前 言 


在 实现 篇 中 ， 为 了 让 OpenJDK 的 部 分 代码 更 易于 阅读 ， 本 书 在 展 
示 代 码 时 有 所 省 略 和 修改 。 

部 分 省 略 如 下 所 示 。 

e 用 于 调试 的 代码 

e 异常 处 理 的 代码 


部 分 修改 如 下 所 示 。 
e 修改 缩 进 

e 换行 

e 英语 注释 的 翻译 
e 为 便于 说 明 添加 了 一 些 注 释 














e 为 便于 说 明 进行 了 宏 展 开 
在 正文 代码 中 ， 以 上 省 略 和 修改 恕 不 逐 行 标注 。 
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本 章 将 介绍 G1GC 的 基础 知识 。 


G1GC 和 实时 性 


G1GC 最 大 的 特征 是 非常 重视 实时 性 。 本 节 首 先 会 介绍 一 般 意 义 上 
的 实时 性 ， 然 后 再 探讨 G1GC 中 的 实时 性 是 什么 样 的 。 











1.1.1 ”实时 性 

处 理 实时 性 的 要 求 是 ， 它 必须 能 在 最 后 期 限 ( deadline ) 之 前 完成 。 

最 后 期 限 可 以 自由 指定 。 如 果 指 定 的 期 限 较 短 ， 那 么 程序 就 要 保证 
在 短 时 间 内 完成 处 理 ; 相反 ， 如 果 指 定 的 期 限 较 长 ， 那 么 程序 只 要 能 
证 在 这 个 较 长 的 时 间 内 完成 处 理 就 可 以 了 。 

另外 ， 即 使 同 为 实时 程序 ， 如 果 处 理 内 容 不 同 ， 最 后 期 限 的 重要 性 
也 会 很 不 一 样 。 有 些 处 理 只 要 超出 最 后 期 限 一 次 ， 就 会 带 来 致命 的 问 
题 ， 而 有 些 处 理 稍微 打破 儿 次 最 后 期 限 也 不 会 有 太 大 的 问题 。 这 两 种 处 
理 分 别称 为 “ 硬 实时 性 ( hard real-time ) 处 理 ” 和 “ 软 实时 性 ( soft real- 
time ) 处 理 ”。 












































1.1.2 ” 硬 实时 性 和 软 实时 性 
硬 实时 性 的 处 理 ， 多 存在 于 保护 人 类 免 于 受伤 、 和 远离 危险 ， 以 安全 
为 第 一 位 的 场景 中 。 例如， 医疗 机 器 人 控制 系统 、 航 空 管制 系统 等 都 
会 要 求 硬 实时 性 。 如 果 这 类 系统 中 的 处 理 超出 了 最 后 期 限 ， 很 可 能 出 现 
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致命 的 问题 。 而 且 ， 硬 实时 性 的 处 理 必须 在 处 理 开始 后 的 很 短 时 间 内 
完成 。 

软 实时 性 处 理 多 用 于 稍微 超出 几 次 最 后 期 限 也 没什么 问题 的 系统 
中 ， 例 如 网 络 银行 系统 。 用 户 总 会 期 待 所 有 的 交易 都 能 完美 地 处 理 好 ， 
但 是 稍微 超出 几 次 最 后 期 限 ， 比 如 交易 完成 界面 的 展示 慢 了 一 些 ， 应 该 
也 不 会 构成 致命 的 问题 。 

软 实时 性 的 处 理 可 以 超出 最 后 期 限 ， 但 超出 期 限 的 频率 很 重要 。 
只 有 超出 频率 在 用 户 能 够 容忍 范围 之 内 的 处 理 ， 我 们 才能 说 它 具 备 软 实 
时 性 。 








1.1.3 ”可 预测 性 


《Java 并 发 编程 实战 》D 的 作者 之 一 布 赖 恩 : 戈 奖 ( Brian Goetz ) 
在 一 篇 文章 中 中 像 下 面 这 样 写 道 : 























实时 处 理 很 多 时 候 会 与 “高 速 性 ”相关 。 但 是 ， 高 速 性 其 实 只 是 实 
时 处 理 的 特征 之 一 。 
对 于 实时 处 理 来 说 ， 真 正 重要 的 特征 是 “可 预测 性 ”。 





实时 处 理 必须 尽力 保证 不 超出 最 后 期 限 。 因 此 相 比 高 速 性 ， 可 预测 
性 更 重要 一 些 。 

这 里 所 说 的 可 预测 性 ， 指 的 是 “可 以 预测 处 理 大 约会 耗费 多 长 时 
间 ”。 即 使 处 理 速度 再 快 ， 如 果 无 法 在 执行 前 预测 出 需要 的 时 间 ， 处 理 
也 是 没有 使 用 价值 的 一 一 因为 该 处 理 存在 随时 超出 最 后 期 限 的 可 能 。 如 
果 能 够 预测 出 大 致 的 处 理 时 间 ， 就 可 以 据 此 来 评估 是 否 会 超出 最 后 期 
限 。 如 果 有 超出 期 限 的 可 能 ， 就 可 以 事先 采取 应 对 措施 ， 例 如 对 处 理 内 
容 进行 分 解 。 

因此 ， 在 保证 实时 性 方面 ， 可 预测 性 是 一 个 重要 的 因素 。 





















































1.1.4 ”G1GC 中 的 实时 性 
G1GC 具有 软 实时 性 。 为 了 实现 软 实时 性 ， 它 具备 以 下 两 个 功能 。 
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中 设置 期 望 暂 停 时 间 ( 最 后 期 限 ) 
@) 可 预测 性 














中 是 支持 用 户 自 定义 mutator 暂停 时 间 的 功能 。G1GC 具有 软 实时 
性 ， 因 此 会 尽力 保证 处 理 不 超过 该 暂停 时 间 。 

@ 是 用 来 预测 下 次 GC 会 导致 mutator 暂停 多 长 时 间 的 功能 。 根 据 
预测 出 来 的 结果 ，G1GC 会 通过 延迟 执行 GC、 拆 分 GC 目标 对 象 等 手 
段 来 遵守 中 设置 的 期 望 暂停 时 间 。 通 过 这 种 方式 ， 能 够 尽量 减少 超出 
用 户 期 望 暂停 时 间 的 频率 ， 从 而 实现 软 实 时 性 。 






































11.5_Java 中 出 现 G1GC 的 背景 

Java ( OpenJDK ) 中 已 经 存在 并 行 GC、 并 发 GC 和 增 量 GC? 等 多 
种 GC 算法。 除了 Java 之 外 ,没有 哪 种 语言 提供 这 么 多 的 GC 算法 供用 
户 选 择 。 那 么 ，Java 为 什么 还 要 增加 新 的 算法 G1GC 呢 ? 

现在 ，Java 语言 广泛 用 于 服务 端 应 用 程序 的 开发 ， 而 其 中 有 些 应 用 
程序 需要 具备 软 实时 性 。 例 如 ， 管 理 电 话 呼叫 的 服务 端 应 用 程序 等 ( 实 
际 上 已 经 存在 一 些 用 Java 语言 实现 的 应 用 程序 了 2 )。 

这 类 应 用 程序 当前 主要 是 采用 增 量 GC 或 者 并 发 GC 来 缩短 最 大 和 暂 
停 时 间 的 。 但 是 ， 缩 短 最 大 暂停 时 间 很 容易 导致 吞吐 量 ? 下 降 。 还 有 ， 
因为 无 法 预测 暂停 时 间 ，GC 可 能 会 有 mutator 长 时 间 停 止 的 风险 。 

于 是 G1GC 诞生 了 ， 其 目的 就 是 高 效 地 实现 软 实时 性 。Java 先前 的 
GC 算法 都 在 一 味 地 尝试 缩短 最 大 暂停 时 间 ， 而 G1GC 则 是 让 用 户 去 设 
置 期 望 暂停 时 间 。 用 户 按照 自己 的 需求 设置 合适 的 GC 暂停 时 间 ， 在 确 
保 吞吐 量 比 以 往 的 GC 更 好 的 前 提 下 ， 实 现 了 软 实 时 性 。 

另外， 追求 软 实时 性 的 服务 端 应 用 程序 ， 大 都 运行 在 拥有 巨大 的 











































































































J 增 量 GC : 通过 慢 慢 地 进行 GC 来 缩短 mutator 最 大 暂停 时 间 的 一 种 手段 。 
@ 出 自 参 考 文献 [3] 中 的 “1.INTRODUCTION”。 
@ 吞吐 量 : 单位 时 间 内 回收 垃圾 的 量 。 如 果 GC 的 春 吐 量 下 降 ， 总 的 暂停 时 间 就 会 变 长 。 
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堆 ” 和 多 处 理 器 的 服务 器 设备 之 上 。 因 此 ， 内 部 的 GC 算法 必须 能 够 在 
短 时 间 内 以 高 吞吐 量 来 处 理 巨大 的 堆 ， 而 且 还 要 高 效 地 发 挥 多 处 理 器 的 
优势 。G1GC 的 设计 就 很 符合 这 些 要求 ， 它 能 够 最 大 程度 地 利用 服务 器 
上 多 处 理 絮 的 优势 ， 而 且 在 处 理 巨 大 的 堆 时 ， 也 不 会 降低 GC 的 性 能 。 


G1GC 中 的 堆 结构 和 列车 GC2 中 的 堆 结 构 非 常 相似 。 

堆 的 内 部 被 划分 为 大 小 相等 的 区 域 ， 所 有 区 域 排列 成 一 排 。G1GC 
以 区 域 为 单位 进行 GC。 用户 可 以 随意 设置 区 域 大 小 ， 但 是 内 部 会 将 用 
户 设 置 的 值 向 上 调整 为 2 的 指数 震 (2 )， 并 以 该 正 数 作为 区 域 的 大 小 
(图 1.1 )。 


堆 
区 域 Dr Se 
(默认 1MB ) 


空闲 区 域 
链表 















































1.1 堆 结 构 





如 果 正 在 分 配对 象 的 某 个 区 域 已 经 满 了 ，GC 线程 会 寻找 下 一 个 空 
闲 的 区 域 来 继续 分 配 。 空 闲 区 域 是 通过 链表 进行 管理 的 ， 因 此 查找 的 时 
间 复 杂 度 是 固定 的 0(1)。 


开放 执行 过 程 


下 面 我 们 简要 地 介绍 一 下 G1GC 的 执行 过 程 。G1GC 主要 有 下 面 两 

















J 堆 : 程序 运行 时 用 于 创建 对 象 的 内 存 区 域 。 
@) 详情 可 参考 “GC 书 ” 算 法 篇 中 的 7.7 节 。 























6 | 第 1 章 G1GC 是 什么 


个 功能 。 


Q@ 并 发 标记 ( concurrent marking ) 


@) 转移 (evacuation ) 


中 并 发 标记 基本 能 和 mnutator 并 发 执行 ， 会 针对 区 域内 所 有 的 存活 


对 象 ”进行 标记 。 


@) 转 移 负责 释 放 堆 中 死亡 对 象 所 占 的 内 存 空 间 。 




















首先 ， 从 众多 区 域 中 选择 一 个 进行 GC 操作 。 如 果 该 区 域 中 有 存活 
对 象 ， 则 将 其 复制 到 其 他 空 闪 区 域 中 (图 1.2 )。 








堆 


























三 本 











图 1.2 扒 的 状态 
白色 区 域 是 空闲 区 域 ， 灰 色 区 域 是 使 用 中 的 区 域 。 左 图 表示 的 是 在 选中 区 


域 后 开始 将 存活 对 象 复制 到 空闲 


区 域 的 操作 ; 右 图 表示 的 是 转移 后 堆 的 状 





态 。 为 了 方便 展示 ， 图 中 的 区 域 以 二 维 的 方式 排列 ， 但 是 在 内 存 中 其 实 是 


如 图 1.1 所 示 排 列 成 一 排 的 。 





当选 择 的 空闲 区 域 也 满 了 的 时 候 ，GC 线程 会 再 次 选择 其 他 空闲 区 
域 来 存放 存活 对 象 。 对 象 复 制 完成 之 后 ， 只 剩 下 死亡 对 象 ” 的 区 域 会 被 


重 置 为 空闲 区 域 以 便 复 用 。 





转移 其 实 也 起 到 了 压缩 的 作用 ， 因 此 G1GC 中 的 区 域 不 会 发 生 碎 














中 存活 对 象 : 活着 的 对 象 ， 即 有 可 能 被 程序 使 用 的 对 象 。 
@) 死亡 对 象 : 已 死亡 的 对 象 ， 即 不 可 能 再 被 程序 使 用 的 对 象 。 
@ 压缩: 将 存活 对 象 挤 到 内 存 中 同一 侧 的 操作 。 因 为 压缩 之 后 对 象 之 间 没 有 空隙 ， 














所 以 区 域 不 会 有 碎片 化 的 问题 。 
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片 化 "。 


让 和 并 发 标记 和 转移 


正如 上 一 节 中 提 到 的 那样 ，G1GC 的 主要 功能 是 并 发 标记 和 转移 。 
其 中 并 发 标记 由 并 发 标记 线程 来 执行 。 

并 发 标记 的 作用 是 在 尽量 不 暂停 mutator 的 情况 下 标记 出 存活 对 象 。 
而 且 ， 还 需要 在 并 发 标记 结束 之 后 记录 下 每 个 区 域内 存活 对 象 的 数量 。 
这 个 信息 在 转移 时 会 用 到 。 

转移 的 作用 是 将 待 回 收 区 域内 的 存活 对 象 复制 到 其 他 的 空闲 区 域 ， 
然后 将 待 回收 区 域 重 置 为 空闲 状态 。 这 很 像 复制 GC 算法 ， 只 不 过 是 以 
区 域 为 单位 进行 的 。 

需要 注意 的 是 ， 并 发 标记 和 转移 在 处 理 上 是 相互 独立 的 。 并 发 标记 
的 结果 信息 对 于 转移 来 说 并 不 是 必须 的 。 因 此 ， 转 移 处 理 可 能 发 生 在 并 
发 标记 开始 之 前 ， 也 可 能 发 生 在 并 发 标记 的 过 程 中 。 






























































了 碎片 化 : 对 象 零散 地 存在 于 堆 中 的 现象 。 











一 人 


党 
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本 章 将 详细 介绍 并 发 标记 。 并 发 标记 的 主要 作用 是 提供 转移 过 程 所 
需要 的 信息 


"局 而 中 什么 是 并 发 标记 


在 简单 标记 中 ， 所 有 可 从 根 直 接触 达 的 对 象 都 会 被 添加 标记 。 带 标 





记 的 是 存活 对 象 ， 








不 带 标记 的 是 死亡 对 象 。 


图 2.1 表示 标记 开始 时 和 结束 时 的 堆 的 状态 。 标 记 结 束 后 ， 可 从 根 


触 达 的 对 象 a、b 、c 者 





作 死 亡 对 象 处 理 。 








Fo 


带 有 标记 ， 而 对 象 4、e 则 会 因为 不 带 标 记 而 被 当 
































区 域 A 





- 
LL 

区 域 B 区 域 A 区 域 B 

图 2.1 标记 开始 时 和 结束 时 的 堆 的 状态 








对 象 a、c 由 根 直 接 引用 。 标 记 结 束 后 ， 可 从 根 触 达 的 对 象 a、b、c 都 带 


有 标记 。 这 里 月 


有 黑色 来 表示 它们 。 








在 并 发 标记 中 ， 存 活 对 象 的 标记 和 mutator 的 运行 几乎 是 并 发 进行 
的 。 相 比 简单 标记 而 言 ， 并 发 标记 的 执行 步 又 更 加 复杂 。 详 情 将 在 2.3 


节 中 介绍 。 








需要 注意 的 是 ， 并 发 标记 其 实 并 不 是 直接 在 对 象 上 添加 标记 ， 而 是 
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在 标记 位 图 ”上 添加 标记 。 


2 夺标 记 位 图 
图 2.2 表示 堆 中 的 一 个 区 域 。 位 图 中 的 黑色 表示 已 标记 ， 白 色 表示 
未 标记 。 








next 








prev 











x 
这 

















未 使 用 








bottom prevTAMS top 
nextTAMS 


图 2.2 标记 位 图 和 区 域 的 内 部 结构 


位 图 中 的 黑色 表示 已 标记 ， 和 白色 表示 未 标记 。 黑 色 的 是 存活 对 象 ， 带 有 又 
号 的 是 死亡 对 象 。 








每 个 区 域 都 带 有 两 个 标记 位 图 : next 和 prev。next 是 本 次 标记 的 
标记 位 图 ， 而 prev 是 上 次 标记 的 标记 位 图 ,保存 了 上 次 标记 的 结果 。 

标记 位 图 中 每 个 比特 都 对 应 着 关联 区 域内 的 对 象 的 开头 部 分 。 我 们 
假设 单个 对 象 的 大 小 都 是 8 个 字 节 ,那么 每 8 个 字 节 就 会 对 应 标记 位 图 
中 的 1 个 比特 。 图 中 标记 位 图 里 黑色 的 地 方 表示 比特 值 是 1， 白 色 的 地 
方 表示 比 特 值 是 0。 相 应 地 ， 区 域内 黑色 的 是 存活 对 象 ， 带 有 叉 号 的 是 
死亡 对 象 。 

图 2.2 中 的 bottom 表示 区 域内 众多 对 象 的 末尾 ，top 表示 开头 。 
nextTAMS 中 的 TAMS 是 “Top At Marking Start”( 标记 开始 时 的 top ) 的 
缩写 。nextTAMS 保存 了 本 次 标记 开始 时 的 top ， 而 prevTAMS 保存 了 上 
次 标记 开始 时 的 top。 



























































中 标记 位 图 : 将 用 于 标记 的 比特 值 等 信息 单独 拿 出 来 放 到 其 他 地 方 ， 用 来 匹配 对 应 
的 对 象 。 
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并 发 标记 过 程 包括 以 下 5 个 步骤 。 





中 初始 标记 阶段 
@) 并 发 标记 阶段 
@) 最 终 标 记 阶段 
@ 存活 对 象 计数 
@@ 收尾 工作 


下 面 分 别 简单 介绍 一 下 各 个 步 又。 

和 暂停 mutator 的 运行 ， 标 记 可 由 根 直 接 引用 的 对 象 。 后 文中 ,我 
们 将 需要 和 暂停 mutator 的 处 理 称 为 暂停 处 理 ( pause )。 

@ 标 记 (扫描 ) 四 中 标记 的 对 象 所 引用 的 对 象 。 本 步骤 会 开启 并 发 
标记 线程 进行 标记 ， 这 个 过 程 和 mnutator 的 运行 是 并 发 进行 的 。 

@ 和 暂停 处 理 。 本 步骤 会 扫描 @ 中 没有 标记 的 对 象 。 在 本 步 又 结束 之 
后 ， 堆 内 所 有 存活 的 对 象 都 会 被 标记 。 

(对 每 个 区 域 中 被 标记 的 对 象 进行 计数 。 这 个 过 程 也 是 和 mutator 
并 发 进行 的 。 

@ 和 暂停 处 理 。 本 步骤 主要 进行 一 些 收尾 工作 ， 并 为 下 次 标记 做 准 
备 。 在 本 步 又 结束 之 后 ， 整 个 并 发 标记 过 程 全 部 结束 。 

其 中 ,@、 轩 、 由 、@@ 这 4 个 步骤 一 般 都 会 开启 多 个 线程 ， 并 行 地 
执行 任务 。 但 是 ， 本 书 中 为 了 便于 读者 理解 ， 会 以 单线 程 执行 为 前 提 展 
开 讨论 。 


和 步骤 1 一 初始 标记 阶段 


从 丁 开始， 我 们 将 详细 介绍 并 发 标记 过 程 中 各 个 步骤 的 处 理 内 
容 。 图 2.3 表示 的 是 堆 中 的 某 个 区 域 。 
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bottom 
prevTAMS 





nextTAMS 


2.3 ”初始 标记 阶段 结束 后 区 域 的 状态 
本 图 和 图 2.2 中 选取 的 是 不 同 的 区 域 。 灰 色 对 象 表示 的 是 未 扫描 的 对 象 。 


在 初始 标记 阶段 ，GC 线程 首先 会 创建 标记 位 图 next。nextTAMS 
指 的 就 是 标记 开始 时 top 所 在 的 位 置 ， 所 以 在 这 里 我 们 将 它 和 top 对 
齐 。 在 创建 位 图 时 ， 其 大 小 也 和 top 对 齐 , 为 “( top-bottom) /8” 字 
节 。 这 些 处 理 都 是 和 mutator 并 发 进行 的 。 

对 可 由 根 直接 引用 的 对 象 进 行 标记 的 过 程 叫 作 根 扫描 。 等 所 有 区 域 
的 标记 位 图 都 创建 完成 之 后 ， 就 可 以 开始 进行 根 扫 描 了 。 

为 了 防止 在 根 扫 描 的 过 程 中 根 被 修改 ， 在 这 个 过 程 中 mutator 是 暂 
停 执 行 的。 虽然 G1GC 中 采用 的 写 屏 障 技术 可 以 获知 对 象 的 修改 ， 但 是 
大 多 数 根 并 不 是 对 象 ， 它 们 的 修改 并 不 能 被 写 屏障 获知 ， 因 此 在 进行 根 
扫描 时 必须 暂停 mutator 的 执行 。 

根 需要 频繁 修改 ， 所 以 其 中 大 部 分 不 在 写 屏 障 可 以 获知 的 范围 内 。 
也 许 G1GC 的 设计 者 认为 ， 与 其 频繁 地 通过 写 屏障 去 获知 修改 的 方式 ， 
还 不 如 直接 暂停 mutator 来 进行 根 扫 描 的 方式 性 能 更 佳 。 

如 果 一 个 对 象 本 身 被 标记 了 ， 但 其 子 对 象 并 没有 被 扫描 ， 我 们 就 称 
它 为 未 扫描 对 象 。 图 2.3 使 用 灰色 表示 未 扫描 对 象 。 虽 然 图 中 该 对 象 已 
在 根 扫描 中 被 标记 ， 但 其 子 对 象 还 没有 被 扫描 到 ， 所 以 是 未 扫描 对 象 
(灰色 )。 也 就 是 说 ， 对 象 C 持 有 子 对 象 A 和 E, 但 是 因为 根 扫描 不 会 扫 
















































































12 | 第 2 发 标记 














描 子 对 象 ， 所 以 对 象 C 作为 未 扫描 对 象 被 表示 为 灰色 。 未 扫描 对 象 C 的 
处 理会 在 后 面 2.5 节 中 讲解 。 
完成 根 扫描 后 ，mutator 会 再 次 开局 执行 ，GC 处理 也 会 进入 下 一 


阶段 。 


OE 


读 屏障 

有 一 种 和 写 屏 障 相对 应 的 技术 ， 叫 作 读 屏障 。 写 屏障 用 来 获知 对 象 的 
修改 ， 而 读 屏 障 用 来 获知 引用 的 读 取 。 

读 屏障 有 多 种 实现 方式 ， 例 如 可 以 在 寄存 器 调 取 内 存 的 时 候 触 发 读 
屏障 。 

读 屏 障 可 以 获知 所 有 的 引用 读 取 ， 因 此 也 能 获知 根 的 变更 ， 所 以 如 果 
使 用 读 屏 障 ， 就 不 需要 在 根 扫描 时 暂停 mutator 了 。 

这 样 看 来 读 屏障 似乎 很 完美 ， 但 实际 上 它 有 一 个 致命 的 缺点 一 一 慢 。 
对 所 有 的 引用 读 取 行 为 都 进行 处 理 ， 其 实 对 系统 来 说 是 很 大 的 负担 。 因 此 
人 们 几乎 不 会 使 用 读 屏 障 。 



















































































/用 步骤 CC 一 一 并 发 标记 阶段 


在 并 发 标记 阶段 ，GC 线程 继续 扫描 在 初始 标记 阶段 被 标记 过 的 对 
象 ， 完 成 对 大 部 分 存活 对 象 的 标记 。 为 什么 说 是 大 部 分 对 象 而 不 是 全 部 
对 象 呢 ? 这 个 会 在 2.6 节 中 解释 。 

图 2.4 表示 的 是 并 发 标记 阶段 结束 后 区 域 的 状态 。 对 象 C 的 子 对 象 
A 和 了 都 被 标记 了 。 像 E 这 样 ， 一 个 对 象 对 应 了 标记 位 图 中 多 个 位 的 情 
况 ， 只 有 起 始 的 标记 位 (mark bit ) 会 被 涂 成 黑色 。 
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图 2.4 并 发 标记 阶段 结束 后 区 域 的 状态 
对 象 C 的 子 对 象 A 和 瑟 被 涂 成 了 黑色 。 在 并 发 标记 执行 期 间 新 创建 的 对 
象 J] 和 也 在 区 域内 被 分 配 了 空间 。 对 象 ] 和 也 被 涂 成 了 黑色 ， 因 此 会 
被 GC 当成 存活 对 象 。 





并 发 标记 阶段 的 一 个 重要 特点 是 GC 线程 和 mutator 是 并 发 执行 的 。 
因为 mutator 在 执行 过 程 中 可 能 会 改变 对 象 之 间 的 引用 关系 ， 所 以 如 果 
只 采用 一 般 的 标记 方法 ， 可 能 会 发 生 “ 标 记 遗 漏 **。 因 此 ， 必 须 使 用 写 
屏障 技术 来 记录 对 象 间 引 用 关系 的 变化 。 和 针对 这 种 情况 ，G1GC 中 所 采 
] 的 写 屏障 将 在 2.5.1 节 中 介绍 。 并 发 标记 阶段 也 会 标记 和 扫描 被 写 屏 
障 获知 变化 的 对 象 。 

处 理 完 待 标记 对 象 之 后 ， 就 会 进入 最 终 标 记 阶 段 。 



































2.5.1 SATB 





SATB ( Snapshot At The Beginning， 初 始 快照 ) 是 一 种 将 并 发 标记 
阶段 开始 时 对 象 间 的 引用 关系 ,以 逻辑 快照 的 形式 进行 保存 的 手段 >。 在 
SATB 中 ,标记 过 程 中 新 生成 的 对 象 会 被 看 作 “ 已 完成 扫描 和 标记 ”， 
此 其 子 对 象 不 会 被 标记 。 图 2.4 中 nextTAMS 和 top 之 间 的 对 象 J] 和 K 
就 是 在 标记 过 程 中 新 生成 的 对 象 。 因 为 它们 的 引用 关系 在 标记 开始 时 并 
不 存在 ， 所 以 它们 都 会 被 当成 存活 对 象 。 因 此 ， 也 不 必 专 门 为 标记 过 程 
中 新 生成 的 对 象 创建 标记 位 图 。 这 样 我 们 就 明白 为 什么 图 2.4 中 对 象 J 



































起 














J 详情 请 参考 “GC 书 ” 算 法 篇 中 的 8.1.4 节 。 
@ 详情 请 参考 “GC 书 ” 算 法 篇 中 的 8.4 节 。 














14 | 第 2 发 标记 

















和 KK 没有 对 应 的 标记 位 图 了 。 

另外 ， 如 果 在 并 发 标记 的 过 程 中 对 象 的 域 上 发 生 了 写 操作 ， 就 必须 
以 某 种 方式 记录 下 被 改写 之 前 的 引用 关系 。G1GC 通过 对 汤 浅 的 算法 ” 
稍 加 优化 而 得 到 的 写 屏 障 技术 ， 实 现 了 这 个 功能 。 因 为 优化 后 的 写 屏 障 
是 用 于 SATB 的 ， 因 此 我 们 称 之 为 SATB 专用 写 屏 障 。SATB 专用 写 屏 
障 的 伪 代 码 如 代码 清单 2.1 所 示 。 
代码 清单 2.1 satb_write_barrier() 函数 


本 一 qefEsabecwcniEegbaremfnenaonenewebl 下 
名 if S$gc phase == GC CONCURRENT MARK: 
3 oldeobie = eld 

4: ue (oberolon = Wa 
3 
6 
外 



































engqueue (Securrentat read tabnlocealoueve oldosy 


eee, Ss Toeielo 


参数 fiel1d 表示 被 写 入 对 象 的 域 ， 参数 newobj 表示 被 写 入 域 的 
值 。 第 2 行 的 Gc _coNCURRENT MARK 用 来 表示 并 发 标记 阶段 的 标志 位 
( flag )。 第 4 行 会 检查 当前 是 否 处 于 并 发 标记 阶段 且 被 写 入 之 前 fielad 
域 的 值 是 不 是 Nul1。 如 果 检 查 通 过 ， 则 在 第 5 行将 ol1dobj 添加 到 
$current thread.stab local queue 中 。 然 后 ， 在 第 7 行进 行 实际 
的 写 人 操作 。 

这 个 算法 没有 对 olaobj 进行 任何 标记 处 理 ， 这 一 点 和 汤 浅 的 算法 
不 同 。 原 生 算 法 会 在 第 4 行 检查 o19dobj 是 否 带 标记 ， 然 后 在 第 5 行进 
行 标记 ,但 G1GC 的 这 个 算法 不 会 对 oldobj 进行 标记 。 具 体 原 因 会 在 
2.5.2 节 中 介绍 。 

男 外， 在 实现 SATB 专用 写 屏障 的 实现 考虑 到 了 多 线程 环境 下 的 执 
行 。 其 中 的 奥妙 就 在 于 第 5 行 的 Scurrent thread.stab local 
queue ( SATB 本 地 队列 )。s$current thread.stab local queue 是 
mutator 各 自持 有 的 线程 本 地 队列 ， 而 非 全 局 的 队列 ， 因 此 在 执行 
























































中 汤 浅 的 算法 : 由 汤 浅 太一 于 1990 年 开发 的 算法 。 这 种 算法 是 以 GC 开始 时 对 象 间 
的 引用 关系 为 基础 来 执行 GC 的 。 详 情 请 参考 “GC 书 ” 算 法 篇 中 的 8.4 节 。 


























编者 注 
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enqueue () 时 不 用 担心 线程 之 间 会 发 生 资源 竞争 。 

如 图 2.5 所 示 ，SATB 本 地 队列 在 装 满 (默认 大 小 为 1 KB ) 之 后 ， 
被 添加 到 全 局 的 SATB 队列 集合 中 。 这 些 被 添加 的 SATB 本 地 队列 ， 都 
是 并 发 标记 阶段 的 待 标记 对 象 。 


消 





SATB 队列 集合 


























ua 
SATB 本 地 队 歹 添加 已 装 满 的 
SATB 本 地 队列 








mutator 2 专用 
SATB 本 地 队 负 








mutator 3 专用 
SATB 本 地 队列 上 

















2.5 SATB 队列 集合 和 SATB 本 地 队列 











在 并 发 标记 阶段 ，GC 线程 会 定期 检查 SATB 队列 集合 的 大 小 。 如 
果 发 现 其 中 有 队列 ， 则 会 对 队列 中 的 全 部 对 象 进行 标记 和 扫描 。 前 面 已 
经 讲 过 ，SATB 专用 写 屏 障 并 不 检查 目标 对 象 是 否 被 标记 ， 因 此 队列 中 
可 能 存在 已 经 被 标记 的 对 象 。 这 些 已 经 被 标记 的 对 象 不 会 再 次 被 标记 和 
扫描 。 

另外 ， 比 起 2.5 节 中 提 到 的 “从 根 开 始 逐 一 扫描 存活 对 象 并 进行 标 
记 的 处 理 "， 扫 描 SATB 队列 集合 的 处 理 优 先 级 更 高 。 这 是 因为 ， 写 屏 
障 会 不 断 地 往 SATB 本 地 队列 中 添加 对 象 ， 但 是 对 象 间 引 用 关系 的 变化 
并 不 会 改变 存活 对 象 的 触 达 链 路 的 总 条 数 。 因 此 ， 扫 描 SATB 队列 纪 
合 ， 比 扫描 存活 对 象 触 达 链 路 的 优先 级 更 高 也 是 合理 的 。 
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2.5.2 _ SATB 专用 写 屏 障 的 优化 
和 汤 浅 的 算法 相 比 ，SATB 专用 写 屏障 有 以 下 两 点 不 同 之 处 。 




















Qa 不 检查 目标 对 象 是 否 被 标记 
@) 不 对 目标 对 象 进行 标记 

















但 是 DD 和 @@ 的 处 理 并 不 是 消失 了 ， 而 是 由 GC 线程 在 并 发 标记 过 
程 中 处 理 了 。 这 样 做 就 可 以 减少 写 屏 障 的 开销 ， 增 加 并 发 标记 的 开销 。 

这 种 优化 的 目的 ， 在 于 将 写 屏 障 的 系统 负荷 转移 到 并 发 标记 处 理 
中 ， 从 而 分 担 mutator 的 负担 。 因 为 mutator 会 频繁 地 执行 写 屏 障 ， 所 以 
减少 写 屏 障 的 开销 也 会 减轻 mutator 的 负担 。 而 且 ， 并 发 标记 处 理 是 由 
GC 线程 和 mutator 并 发 执行 的 ， 所 以 多 个 mutator 就 能 平 挫 这 些 负担 ， 
进而 减轻 单个 mutator 的 负担 。 

如 果 把 这 些 优化 放 到 不 支持 并 发 标记 的 GC 中 ,该 GC 的 负荷 反而 
会 增加 。 这 种 针对 写 屏 障 的 优化 ， 可 以 说 是 专 为 采用 了 并 发 标记 的 
G1GC 设计 的 。 


























2.5.3 ”SATB 专用 写 屏 障 和 多 线程 执行 
我 们 再 看 一 下 代码 清单 2.2。 


代码 清单 2.2 satb_write_barrier() 函数 ( 再 次 出 现 ) 


Tceat onweitenbarrier el evo 
名 if S$gc phase == GC CONCURRENT MARK: 
8 coudoBy frelde// (ay 

4: olol I Nl 
号 
6 
外 





enqueue ($current thread.stab local queue, oldobj) // (b) 


*field = newobj // (c) 


代码 清单 2.2 中 的 代码 会 在 各 mutator 的 对 象 发 生 改 写 时 被 调用 执 
行 。 但是， 代码 中 (a) 到 (c) 的 步 又 并 没有 加 锁 ， 所 以 如 果 多 个 线程 同时 
改写 域 *field，oldobj 就 可 能 会 存 人 意 想 不 到 的 值 。 

例如 下 面 这 样 的 场景 。 
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e *field 的 值 是 opj0 (对象 的 地 址 ) 
etl (线程 1 ) 想 要 往 *field 中 写 人 obj1 
et2 (线程 2 ) 想 要 往 *field 中 写 人 obj2 














如 果 { 和 也 按照 先后 顺序 执行 ,那么 1 会 往 SATB 本 地 队列 中 写 
入 obj0，t 会 写 入 opj1l。 但 是 tl 和 也 也 有 可 能 按照 以 下 顺序 执行 。 


| 








Ot 执行 (a) : oldobj = obj0 

@)t2 执行 (a) : oldobj = obj0 

G@)tl 执行 (b) : obj0 被 添加 到 $current_thread.stab local 
queue 中 

由 蕊 执行 (b) : obj0 被 添加 到 Scurrent thread.stab local 
queue 中 

@)tl 执行 (c) : *field = objl 

(OOt2 执行 (c) : *field = obj2 





在 这 种 情况 下 ，*field 最终 会 被 世 写 入 obj2。 但 是 tl 写 入 的 
objl 并 不 会 被 添加 到 SATB 本 地 队列 中 。 也 就 是 说 ，obj1 并 没有 被 
SATB 专用 写 屏 障 获知 。 这 看 起 来 像 是 致命 的 缺陷 ， 但 实际 上 ， 即 使 
obj1 没有 被 添加 到 SATB 本 地 队列 中 也 没有 关系 。 

SATB 专用 写 屏 障 本 来 是 用 来 防止 发 生 标记 遗漏 的 ,那么 obj1 没 
有 被 添加 到 SATB 本 地 队列 这 件 事 会 不 会 导致 标记 遗漏 呢 ? 

图 2.6 表示 的 是 obj1 未 被 SATB 专用 写 屏障 获知 时 对 象 之 间 的 关 
系 。 我 们 假定 并 发 标记 进行 到 了 obj3。 由 于 objl 不 会 被 添加 到 SATB 
本 地 队列 中 ， 所 以 会 保持 为 白色 。 而 objo0 会 被 添加 到 SATB 本 地 队列 
中 ， 所 以 会 变 成 灰色 。 但 是 在 后 续 扫 描 obj4 时 ，obj1 最 终 还 是 会 被 标 
记 ， 所 以 不 存在 标记 遗漏 。 
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obj3 
obj4 obj3 obj4 
obj2 ， sb]2 
obj0 obj1 obj0 obj1 


2.6 ”obj1 未 被 SATB 专用 写 屏障 获知 时 对 象 之 间 的 关系 


标记 完成 的 对 象 用 黑色 表示 ; 添加 到 SATB 本 地 队列 中 的 对 象 用 灰色 表 
示 ; 其 余 对 象 用 白色 表示 。 

















那么 ， 如果 opjl 不 再 被 obj4 引用 ， 而 变 为 被 obj2 引用 时 ， 人 情况 
又 是 怎样 的 呢 ? 图 2.7 进行 了 演示 。 


obj3 obj4 obj3 村 
obj2 j 
obj0 obj1 obj0 obj1 


2.7 ”obj1 不 再 被 obj4 引用 ， 变 为 被 obj2 引用 时 对 象 之 间 的 关系 
当 来 自 obj4 的 引用 消失 时 ，obj1 就 会 变 成 灰色 。 











在 这 种 情况 下 ， 来自 obj4 的 引用 消失 会 被 SATB 专用 写 屏障 获知 ， 
obj1 会 变 成 灰色 ， 所 以 也 不 会 有 问题 。 

SATB 专用 写 屏障 会 记录 下 并 发 标记 阶段 开始 时 对 象 之 间 的 引用 关 
系 。 这 人 么 来 看 ， 因 为 obj3 对 obj1 的 引用 在 并 发 标记 阶段 开始 时 并 不 存 
在 ， 所 以 根本 没有 必要 记录 obj1。 相 反 ， 因 为 obj3 对 objo 的 引用 在 
并 发 标记 阶段 开始 时 就 存在 ， 所 以 记录 obj0 是 有 必要 的 。 

代码 清单 2.2 中 (a) 到 (c) 的 步骤 虽然 没有 加 锁 ， 但 是 SATB 专用 写 
屏障 技术 严格 遵守 了 前 面 这 些 约束 条 件 ， 所 以 即使 不 记录 obj1 也 是 没 
有 问题 的 。 


忠和 步骤 9 一 一 最 终 标记 阶段 


最 终 标记 阶段 的 处 理 是 暂停 处 理 ， 需 要 暂停 mutator 的 运行 。 
因为 未 装 满 的 SATB 本 地 队列 不 会 被 添加 到 SATB 队列 集合 中 ， 所 
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以 在 并 发 标记 阶段 结束 后 ， 各 个 线程 的 SATB 本 地 队列 中 可 能 仍然 存在 
竺 扫描 的 对 象 。 而 最 终 标记 阶段 就 会 扫描 这 些 “ 残 留 的 SATB 本 地 队 
列 ”。 在 图 2.8 中 ， 队 列 中 保存 了 对 象 G 和 HH 的 引用 。 因 此 在 扫描 SATB 
本 地 队列 之 后 ， 对 象 G 和 理 ， 以 及 对 象 H 的 子 对 象 1 都 会 被 标记 。 





mutator 线程 1 


专用 SATB 本 。 [CYE 


























地 队列 
全 部 扫描 
pr 扫描 后 
next ey ( 最终 标记 阶段 结束 后 ) 
prev 











bottom nextTAMS top 
prevTAMS 


2.8 ”最终 标记 阶段 结束 后 区 域 的 状态 
因为 SATB 本 地 队列 中 存在 对 象 G 和 囊 的 引用 ， 所 以 扫描 后 ， 对 象 G 和 
H， 以 及 对 象 晶 的 子 对 象 1 都 会 变 成 黑色 。 
本 步骤 结束 后 ， 所 有 的 存活 对 象 都 已 被 标记 。 因 此 ， 此 时 所 有 不 带 
标记 的 对 象 都 可 以 判定 为 死亡 对 象 。 
为 SATB 本 地 队列 中 的 数据 会 被 mutator 操作 ， 所 以 本 步骤 不 能 
和 mnutator 并 发 执行 。 


亏 人 步骤 (4 一 一 存活 对 象 计数 


这 个 步骤 会 扫描 各 个 区 域 的 标记 位 图 next， 统 计 区 域内 存活 对 象 
的 字 节 数 ， 然 后 将 其 存 人 区 域内 的 next_marked_bytes 中 。 图 2.9 中 
的 存活 对 象 是 A、C、E、G、H 和 1I， 因 此 计算 出 的 总 字 节 数 56 会 被 存 
人 next_marked bytes 中 。 对 象 E 虽然 只 有 头 部 的 1 个 比特 被 标记 了 ， 
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但 参与 统计 的 是 它 的 真实 大 小 ， 即 16 字 节 。 


nsxt 


本 醒 加 图 | 


next marked bytes 56 











prev 


prev_marked bytes 0 























bottom nextTAMS top 
prevTAMS 


图 2.9 存活 对 象 计数 结束 后 区 域 的 状态 


next_marked _bytes 表示 对 象 A、C、E、G、HH 和 I 的 总 字 节 数 ， 一共 
56 字 节 。 计 数 过 程 中 新 创建 了 对 象 L 和 M。 





另外 ,我 们 假设 在 计数 过 程 中 新 创建 了 对 象 L 和 M。 由 于 这 些 包含 
在 nextTAMS 和 top 之 间 的 对 象 都 会 被 当 作 存活 对 象 来 处 理 ， 所 以 不 会 
在 这 里 特意 进行 计数 。 

prev_marked_bytes 中 存放 了 上 次 标记 结束 时 存活 对 象 的 字 节 数 。 
图 2.9 中 的 区 域 在 此 之 前 未 曾 进行 过 标记 ， 因 此 prev_marked bytes 
中 存放 的 是 初始 值 0。 

计数 处 理 和 mutator 是 并 发 执行 的 。 但 是 ， 计 数 过 程 中 操作 的 对 象 
也 可 能 会 被 转移 的 记忆 集合 ( remembered set ) 线程 使 用 ， 因 此 需要 先 
停 掉 记忆 集合 线程 。 

另外 ， 转 移 处 理 也 可 能 在 计数 过 程 中 启动 。 这 时 ， 需 要 先 将 正在 计 
数 中 的 区 域 统计 完 ， 再 开始 转移 处 理 。 已 完成 计数 的 区 域 在 转移 后 会 变 
成 空 区 域 ， 所 以 next_marked_bytes 也 会 变 成 0。 而 转移 目标 区 域内 
都 是 存活 对 象 ， 所 以 也 不 会 对 它 进行 计数 。 
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/页 ; 晶 步骤 一 一 收尾 工作 


收尾 工作 所 操作 的 数据 中 有 些 是 和 mutator 共享 的 ， 因 此 需要 和 暂停 
mnutator 的 运行 。 

在 此 期 间 GC 线程 会 逐个 扫描 每 个 区 域 ， 将 标记 位 图 next 中 的 并 
发 标记 结果 移动 到 标记 位 图 prev 中 ， 再 对 并 发 标记 中 使 用 过 的 标记 值 
进行 重 置 ， 为 下 次 并 发 标记 做 好 准备 。 

此 外 ， 对 没有 存活 对 象 的 区 域 进行 回收 的 工作 也 在 这 个 时 候 进 行 。 
可 以 把 它 理解 成 以 区 域 为 单位 进行 的 清除 了 处理。 

在 扫描 过 程 中 还 会 计算 每 个 区 域 的 转移 效率 ， 并 按照 该 效率 对 区 域 
进行 降序 排序 。 关 于 转移 效率 的 内 容 ， 我 们 将 在 2.8.1 节 中 介绍 。 

图 2.10 展示 了 收尾 工作 结束 后 区 域 的 状态 。 图 2.9 里 next : next 
marked_pytes 中 的 值 被 移 到 了 prev ' prev_marked bytes 中 。 同 时 ， 
prevTAMS 被 移 到 了 nextTAMS 先前 的 位 置 。prevTAMS 表示 的 是 “上 次 
并 发 标记 开始 时 top 的 位 置 ”。 

































































XxX 


























next 
next_ marked bytes 0 
preyv 
prev_marked bytes 56 














pottom prevTAMS top 
nextTAMS 


2.10 ”收尾 工作 完成 后 区 域 的 状态 
next 中 的 信息 会 被 移 到 prev 中 。 


next * next marked bytes 也 会 被 重 置 ， 同 时 nextTAMS 会 移动 到 





中 清除 : 即 标记 一 清除 GC 中 的 清除 ， 指 释放 那些 不 带 标记 的 对 象 的 内 存 空 间 。 
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bottonm 的 位 置 。nextTAMS 会 在 下 次 并 发 标记 开始 时 ， 移 动 到 top 的 最 
新 位 置 ( 参考 2.4 节 )。 

收尾 工作 结束 后 ， 整 个 并 发 标记 就 结束 了 。 并 发 标记 线程 会 一 直 处 
于 等 待 状态 ， 直 到 下 次 并 发 标记 开始 。 


























转移 效率 

转移 效率 可 以 通过 公式 “死亡 对 象 的 字 节 数 + 转移 所 需 时 间 ” 来 
计算 。 换 句 话 说， 转移 效率 指 的 就 是 转移 1 个 字 节 所 需 的 时 间 。 区 域 的 
转移 效率 可 以 通过 公式 “区 域内 死亡 对 象 的 字 节 数 * 转移 整个 区 域 所 
需 时 间 ” 来 计算 。 

这 里 的 “转移 所 需 时 间 ” 严 格 来 说 是 转移 的 预测 时 间 。 转 移 的 预测 
时 间 可 以 根据 过 去 的 实际 转移 时 间 来 计算 。 详 细 内 容 将 在 4.2 节 中 介绍 。 

另外 ,一般 来 说 死亡 对象 越 多 ， 转 移 效 率 就 越 高 。 死 亡 对 象 多 就 意 
味 着 存活 对 象 少 ; 存活 对 象 越 少 ， 转 移 所 需 的 时 间 就 越 少 ， 所 以 转移 效 

转移 效率 这 一 重要 概念 在 后 文中 会 多 次 出 现 ， 请 理解 清楚 并 记 牢 。 


并 发 标记 结束 后 ， 转 移 处 理 可 以 得 到 以 下 信息 (参考 图 2.10 )。 

















Q 并 发 标记 完成 时 存活 对 象 和 死亡 对 象 的 区 分 ( 标记 位 图 prev ) 
@) 存活 对 象 的 字 节 数 (prev_marked bytes ) 





这 些 信息 在 并 发 标记 阶段 不 会 被 改变 ， 因 此 ， 即 使 在 并 发 标记 阶段 
就 开始 转移 处 理 也 不 会 有 问题 。 另 外 ， 虽 然 新 的 对 象 是 在 并 发 标记 结 
后 被 创建 的 ， 但 由 于 它 是 分 配 在 prevTAMS 和 top 之 间 的 ， 所 以 会 被 当 
成 存活 对 象 处 理 。 
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对 象 的 担忧 ( 死亡 标记 ) + 


对 象 A :“ 喂 ， 你 头 上 的 是 死亡 标记 吧 ?” 
对 象 B :“ 啊 ! 好 可 怕 !” 
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9 


3 


对 象 B :“ 哦 ， 原 来 不 是 死亡 标记 ， 而 是 存活 标记 啊 。” 


A\lu \., 








本 章 将 介绍 实际 进行 GC 的 转移 功能 。 


< 天 天 昌 什 么 是 转移 


通过 转移 ， 所 选区 域内 的 所 有 存活 对 象 都 会 被 转移 到 空闲 区 域 。 这 
样 一 来 ， 被 转移 的 区 域内 就 只 剩 下 死亡 对 象 。 重 置 之 后 ， 该 区 域 就 会 成 
为 空闲 区 域 ， 能 够 再 次 利用 。 

图 3.1 表示 了 转移 开始 前 和 结束 后 的 状态 。 转 移 结束 后 ， 可 从 根 触 
达 的 存活 对 象 4a、b、c 会 被 转移 到 空闲 区 域 C， 而 死亡 对 象 4 和 e 不 会 
被 转移 ， 整 个 区 域 B 会 被 重 置 以 供 再 次 利用 。 

























































































空 亲 空 亲 (aflvle) 
区 域 A 区 域 B 区 域 C 








图 3.1 转移 开始 前 和 结束 后 的 状态 


待 转移 对 象 所 在 的 区 域 是 A 和 B。 可 从 根 触 达 的 对 象 a、b、c 会 被 转移 到 
区 域 C。 
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“总 届 转移 专用 记忆 集合 


除了 可 以 从 根 和 并 发 标记 的 结果 发 现存 活 对 象 之 外 ， 转 移 功能 还 能 
通过 转移 专用 记忆 集合 来 发 现 对 象 。2.5.1 节 介 绍 的 SATB 队列 集合 主要 
用 来 记录 标记 过 程 中 对 象 之 间 引 用 关系 的 变化 ， 而 转移 专用 记忆 集合 则 
用 来 记录 区 域 之 间 的 引用 关系 。 通 过 使 用 转移 专用 记忆 集合 ， 在 转移 时 
即使 不 扫描 所 有 区 域内 的 对 象 ， 也 可 以 查 到 待 转移 对 象 所 在 区 域内 的 对 
象 被 其 他 区 域 引用 的 情况 ， 从 而 简化 单个 区 域 的 转移 处 理 (图 3.2 )。 




















记录 在 转移 专用 记忆 
集合 中 













待 转移 对 象 
所 在 区 域 











其 他 区 域 


图 3.2 转移 专用 记忆 集合 


转移 专用 记忆 集合 中 记录 了 来 自 其 他 区 域 的 引用 ， 因 此 即使 不 扫描 所 有 区 
域内 的 对 象 ， 也 可 以 确定 待 转移 对 象 所 在 区 域内 的 存活 对 象 。 





G1GC 是 通过 卡 表 ( card table ) 来 实现 转移 专用 记忆 集合 的 。 


3.2.1 ” 卡 表 

卡 表 是 由 元 素 大 小 为 1 B 的 数组 实现 的 ( 图 3.3 )。 卡 表 里 的 元 素 称 为 
卡片 。 堆 中 大 小 适当 的 一 段 存储 空间 会 对 应 卡 表 中 的 1 个 元 素 (卡片 )。 
在 当前 的 JDK 中 ， 这 个 大 小 被 定 为 312 B。 因 此 ， 当 堆 的 大 小 是 1 GB 
时 ， 可 以 计算 出 卡 表 的 大 小 就 是 2 MB。 
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卡 表 
= 片 数 儿 
(卡片 数组 ) ma 
索引 3 2097151 2097152 
me [LT 国 因 E 上 片 
/11 堆 
(1GB) 
区 域 ee 
512B 


图 3.3 卡 表 的 构造 


卡 表 的 实体 是 数组 。 数 组 的 元 素 是 1 B 的 卡片 ， 对 应 了 堆 中 的 512 B。 脏 
卡片 用 灰色 表示 ， 净 卡片 用 白色 表示 。 


堆 中 的 对 象 所 对 应 的 卡片 在 卡 表 中 的 索引 值 可 以 通过 以 下 公式 快速 
计算 出 来 。 

(对 象 的 地 址 - 推 的 头 部 地 址 ) / 512 

因为 卡片 的 大 小 是 1 B， 所 以 可 以 用 来 表示 很 多 状态 。 卡 片 的 种 类 
很 多 ， 本 书 主要 关注 以 下 两 种 。 


d 净 卡 片 
@ 脏 卡 片 











关于 这 两 种 卡片 的 详细 内 容 ， 我 们 将 在 3.3 节 中 介绍 。 其 他 卡片 是 
JDK 在 实现 过 程 中 根据 需要 引入 的 ， 本 书 就 不 袭 述 了 


3.2.2 ”转移 专用 记忆 集合 的 构造 
转移 专用 记忆 集合 的 构造 如 图 3.4 所 示 。 
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转移 专用 记忆 集合 A 卡 表 

〈 散 列表 ) 0 2048 
键 [CTD]B] 键 是 区 域 的 地 址 CT 











值 “ 必 个 蔬 ?[ 划 值 是 卡片 索引 的 数组 








; 对 应 的 卡片 索引 是 2048 


由 | 用 4 
区 域 A $12.B 


引用 区 域 B 


图 3.4 转移 专用 记忆 集合 的 构造 
每 个 区 域 都 有 一 个 转移 专用 记忆 集合 ， 它 是 通过 散 列 表 实 现 的 。 图 中 对 象 
b 引用 了 对 象 a， 因 此 对 象 b 所 对 应 的 卡片 索引 就 被 记录 在 了 区 域 A 的 转 
移 专用 记忆 集合 中 。 























每 个 区 域 中 都 有 一 个 转移 专用 记忆 集合 ， 它 是 通过 散 列 表 实现 的 。 
散 列 表 的 刍 是 引用 本 区 域 的 其 他 区 域 的 地 址 ， 而 散 列表 的 值 是 一 个 数 
组 ,数组 的 元 素 是 引用 方 的 对 象 所 对 应 的 卡片 索引 。 

在 图 3.4 中 ， 区域 B 中 的 对 象 b 引 用 了 区 域 A 中 的 对 象 a。 因 为 对 
象 b 不 是 区 域 A 中 的 对 象 ， 所 以 必须 记录 下 这 个 引用 关系 。 而 在 转移 专 
用 记忆 集合 A 中 ， 以 区 域 B 的 地 址 为 键 的 值 中 记录 了 卡片 的 索引 2048。 
因为 对 象 b 所 对 应 的 卡片 索引 就 是 2048， 所 以 对 象 b 对 对 象 a 的 引用 被 
准确 地 记录 了 下 来 。 

由 此 我 们 可 以 明白 ， 区 域 间 对 象 的 引用 关系 是 由 转移 专用 记忆 集合 
以 卡片 为 单位 粗略 记录 的 。 因 此 ， 在 转移 时 必须 扫描 被 记录 的 卡片 所 对 
应 的 全 部 对 象 的 引用 。 关 于 这 一 点 的 详细 内 容 ， 我 们 将 在 3.8 节 中 介绍 。 


< 天 曙 转移 专用 写 屏 障 


当 对 象 的 域 被 修改 时 ， 被 修改 对 象 所 对 应 的 卡片 会 被 转移 专用 写 屏 
障 记录 到 转移 专用 记忆 集合 中 。 转 移 专 用 写 屏障 的 伪 代 码 如 代码 清单 
3.1 所 示 。 
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代码 清单 3.1 ” evacuation_write_barrier() 函数 


efEevVacUaETORENETEESOaGTeEWUCbIREETeTd nw oD 
check = obj ”~ newobj 


3 check = check >> LOG OF HEAP REGION SIZE 
4: Mie Mavenelo) Se Ms 

5 enecke=n 

6 人 EC 三 

FeEun 

8 

9 fenotensom eyeardl(oba: 

OE Iseel he syle 

Wl engqueue leusentat read lo ob 


13: *field = newobj 





这 个 函数 的 参数 和 第 2 章 中 代码 清单 2.1 的 作用 相同 。 

第 2 行 到 第 7 行 的 代码 会 在 obj 和 newobj 位 于 同一 个 区 域 ， 或 者 
newobj 为 Null 时 ， 起 到 过 滤 的 作用 。 这 是 达尔 科 … 斯 特 凡 诺 维 奇 
( Darko Stefanovié ) 等 人 印 提 出 的 过 滤 技 术 。 我 们 逐 行 分 析 一 下 代码 。 

第 2 行 的 “^”( XOR 运算 符 ) 用 来 检测 两 个 对 象 地 址 的 高 位 部 分 是 否 相 
等 。 每 个 区 域 都 是 按 固定 大 小 进行 分 配 的 ， 如 果 obj 和 newobj 是 同一 个 区 
域 中 的 地 址 ， 那 么 由 于 两 个 地 址 中 超过 区 域 大 小 的 高 位 部 分 是 完全 相等 的 ， 
所 以 第 2 行 变量 check 的 值 小 于 区 域 的 大 小 。 第 3 行 的 LOG_OF_HEAP_ 
REGION_SIZE 是 区 域 大 小 的 对 数 ( 底 为 2 )。1.2 节 提 到 过 ， 区 域 大 小 必须 是 
“2 的 指数 害 ”( 2" )， 而 指数 n 就 是 LOG OF HEAP REGION SIZE。 将 
check 右 移 LOG_ OF HEAP REGION SIZE 后 ， 小 于 区 域 大 小 的 比特 值 都 会 
日 0。 这 样 一 来 ， 如 果 check 的 值 小 于 区 域 大 小 ， 右 移 之 后 的 结果 就 会 变 为 
0。 第 4 行 检查 newobj 是 否 为 Nul1， 第 6 行 检 查 check 是 否 为 0。 

第 9 行 的 函数 is_dirty_card() 用 来 检查 参数 obj 所 对 应 的 卡片 
是 否 为 脏 卡 片 。 脏 卡片 指 的 是 已 经 被 转移 专用 写 屏障 添加 到 转移 专用 记 
忆 集合 日 志 中 的 卡片 。 该 行 的 检查 就 是 为 了 避免 向 转移 专用 记忆 集合 日 
志 中 添加 重复 的 卡片 。 相 反 ， 不 在 转移 专用 记忆 集合 日 志 中 的 卡片 是 净 
卡片 。 如 果 是 净 卡 片 ， 则 该 卡片 将 在 第 10 行 变 成 脏 卡 片 ， 然 后 在 第 11 
行 被 添加 到 队列 $current_thread.rs_1og 中 。 这 个 处 理 能 够 保证 转 
移 专用 记忆 集合 日 志 中 的 卡片 都 是 脏 卡片 。 
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另外 ， 转 移 专 用 写 屏 障 和 SATB 专用 写 屏 障 做 了 同样 的 优化 ， 在 多 
线程 环境 下 性 能 也 不 会 变 差 。 

图 3.5 表示 了 “转移 专用 记忆 集合 日 志 ” 和 “转移 专用 记忆 集合 日 
志 集 合 ” 的 结构 。 每 个 mutator 线程 都 持 有 一 个 名 为 转移 专用 记忆 集合 
日 志 的 缓冲 区 ， 其 中 存放 的 是 卡片 索引 的 数组 。 当 对 象 b 的 域 被 修改 
时 ， 写 屏障 就 会 获知 ， 并 会 将 对 象 b 所 对 应 的 卡片 索引 添加 到 转移 专用 
记忆 和 集合 日 志 中 。 和 转移 专用 记忆 集合 日 志 是 由 各 个 mutator 线程 持 有 的 ， 
所 以 在 添加 时 不 用 担心 线程 之 间 的 竞争 。 也 是 得 益 于 这 种 设计 ， 转 移 专 
用 写 屏障 不 需要 进行 排他 处 理 ， 因 而 具有 更 好 的 性 能 。 代 码 清单 3.1 中 
的 $Scurrent thread.rs_ log 就 是 转移 专用 记忆 集合 日 志 。 

































































mutator 线程 A 的 转 mutator 线程 B 的 转 
移 专 用 记忆 集合 日 志 ” 移 专用 记忆 集合 日 志 






































(索引 的 数组 ) (索引 的 数组 ) 
Bs 
/ 区 到 、 区 可 
” 国 \ 
: 1 
I | 号 满 了 
/ | 


























转移 专用 记忆 集合 日 志 集合 
(数组 ) 


写 满 的 转移 专用 记忆 集合 日 志 























nn 


新 添加 






































图 3.5 ”转移 专用 记忆 集合 日 志 及 其 集合 
当 mutator 线程 A 的 转移 专用 记忆 集合 日 志 写 满 之 后 ， 它 会 被 添加 到 转移 
专用 集合 日 志 的 集合 中 。 
另外 ， 转 移 专 用 记忆 集合 日 志 会 在 写 满 后 被 添加 到 全 局 的 转移 专用 
记忆 集合 日 志 集合 中 。 这 个 添加 过 程 可 能 存在 多 个 线程 之 间 的 竞争 ， 所 
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以 需要 做 好 排他 处 理 。 添 加 完成 后 ，mutator 会 被 重新 分 配 一 个 空 的 转 
移 专 用 记忆 集合 日 志 。 


s 陛 转移 专用 记忆 集合 维护 线程 
转移 专用 记忆 集合 维护 线程 是 和 mutator 并 发 执行 的 线程 ， 它 的 作 
用 是 基于 转移 专用 记忆 集合 日 志 的 集合 ， 来 维护 转移 专用 记忆 集合 
具体 来 说 ， 转 移 专 用 记忆 集合 维护 线程 主要 进行 下 列 处 理 (请 同时 
参考 图 3.6 )。 





























J 从 转移 专用 记忆 集合 日 志 的 集合 中 取出 转移 专用 记忆 集合 日 志 ， 
从 头 开始 扫 摘 

@) 将 卡片 变 为 净 卡 片 

(3) 检查 卡片 所 对 应 存储 空间 内 所 有 对 象 的 域 

@ 往 域 中 地 址 所 指向 的 区 域 的 记忆 集合 中 添加 卡片 


























OO 扫描 © 转移 专用 记忆 集合 日 志 
二。 转移 专用 记忆 集合 日 志 将 卡片 变 为 妆 卡 片 5 二 3 .区 
2048] 4 T2344 ... [5262[ 52 ] 
取出 














2048 

:CE ... 
i i < 卡 表 
A SE 、 
es [re 
转移 专用 记忆 集合 日 志 的 集合 SO 






















































































区 域 B 
图 扫 撒 卡片 所 对 应 存储 空间 内 所 有 对 象 ® 
转移 专用 记忆 集合 A 转移 专用 记忆 集合 C 

GD B [ A 
上 
6364 了 3476 
6932 :2048 

| 区域 A 内 的 | | 区 域 C 内 的 | 

| 对象 | | 对 条 | 2048 

















将 卡片 添加 到 各 自 的 记忆 集 


o> 


中 








图 3.6 由 转移 专用 记忆 集合 维护 线程 负责 向 转移 专用 记忆 集合 中 记录 
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如 果 卡 片 在 @@ 和 的 处 理 过 程 中 被 mutator 修改 了 ,那么 又 会 变 成 
脏 卡片 ， 然 后 再 次 被 添加 到 转移 专用 记忆 集合 日 志 中 。 

在 转移 专用 记忆 集合 日 志 的 集合 中 ， 当 转移 专用 记忆 集合 日 志 的 数 
量 超过 阔 值 (默认 为 5 个 ) 时 ， 转 移 专 用 记忆 集合 维护 线程 就 会 启动 ， 
然后 一 直 处 理 到 数量 降 至 阔 值 的 /4 以 下 。 


频繁 发 生 修 改 的 存储 空间 所 对 应 的 卡片 称 为 热 卡片 (hot card )。 热 
卡片 可 能 会 多 次 被 转移 专用 记忆 集合 维护 线程 处 理 成 脏 卡片 ， 从 而 加 重 
转移 专用 记忆 集合 维护 线程 的 负担 ， 因 此 需要 特别 处 理 。 

要 想 发 现 热 卡片 ， 需 要 用 到 卡片 计数 表 ， 它 记录 了 卡片 变 成 脏 卡 片 
的 次 数 。 卡 片 计数 表 记 录 了 自 上 次 转移 以 来 哪个 卡片 变 成 了 脏 卡片 ， 以 
及 变 成 脏 卡片 的 次 数 ， 其 内 容 会 在 下 次 转移 时 被 清空 。 

变 成 脏 卡 片 的 次 数 超过 国 值 ( 默认 是 4) 的 卡片 会 被 当成 热 卡 片 ， 
在 被 处 理 为 脏 卡 片 后 添加 到 热 队 列 尾 部 。 热 队列 的 大 小 是 固定 的 ( 默认 
是 1 KB )。 如 有 果 队 列 满 了 ， 则 从 队列 头 部 取出 老 的 卡片 ， 给 新 的 卡片 腾 
出 位 置 。 取 出 的 卡片 由 转移 专用 记忆 集合 维护 线程 当 作 普 通 卡片 处 理 。 

热 队 列 中 的 卡片 不 会 被 转移 专用 记忆 集合 维护 线程 处 理 ， 因 为 即使 
处 理 了 ， 它 也 有 可 能 马上 又 变 成 脏 卡 片 。 因 此 ， 热 队列 中 的 卡片 会 被 留 
到 转移 的 时 候 再 处 理 。 


转移 的 执行 步骤 为 以 下 3 个 。 






























































中 选择 回收 集合 
@) 根 转移 
(3) 转移 


中 是 指 参考 并 发 标记 提供 的 信息 来 选择 被 转移 的 区 域 。 被 选中 的 区 
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域 称 为 回收 集合 ( collection set )。 

@g 是 指 将 回收 集合 内 由 根 直接 纪 
对 象 转移 到 空闲 区 域 中 。 

@ 是 指 以 @ 中 转移 的 对 象 为 起 点 扫描 其 子孙 对 象 ， 将 所 有 存活 对 象 
一 并 转移 。 当 结束 之 后 ， 回 收集 合 内 的 所 有 存活 对 象 就 转移 完成 了 。 

这 3 个 步 又 都 是 暂停 处 理 。 在 转移 开始 后 ， 即 使 并 发 标记 正在 进行 
也 会 先 中 断 ， 而 优先 进行 转移 处 理 。 

另外 ，@ 和 外 其 实 都 是 可 以 由 多 个 线程 并 行 执行 的 ， 但 是 为 了 便于 
读者 理解 ， 本 书 进行 了 简化 ， 是 以 单线 程 执 行为 前 提 展 开 讨论 的 。 


步骤 人 一 一 选择 回收 集合 


本 步骤 的 主要 工作 是 选择 回收 集合 。 选 择 标准 简单 来 说 有 两 个 。 


用 的 对 象 ， 以 及 被 其 他 区 域 引用 的 


















































中 转移 效率 高 
@ 转移 的 预测 暂停 时 间 在 用 户 的 容忍 范 
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mn 
Cy 














在 选择 回收 集合 时 ， 堆 中 的 区 域 已 经 在 2.8 节 的 步骤 中 按照 转移 
效率 被 降序 排列 了 。 

接 下 来 ， 按 照排 好 的 顺序 依次 计算 各 个 区 域 的 预测 暂停 时 间 ， 并 选 
择 回收 集合 。 当 所 有 已 选区 域 预测 暂停 时 间 的 总 和 快要 超过 用 户 的 容忍 
范围 时 ， 后 续 区 域 的 选择 就 会 停止 ， 所 有 已 选区 域 成 为 1 个 回收 集合 。 
关于 转移 的 预测 暂停 时 间 ，4.2 节 将 详细 介绍 。 

G1GC 中 的 G1 是 Garbage First 的 简称 ， 所 以 G1GC 的 中 文 意思 是 
“垃圾 优先 的 垃圾 回收 ”"。 而 回收 集合 的 选择 ， 会 以 转移 效率 由 高 到 低 的 
顺序 进行 。 在 多 数 情况 下 ， 死 亡 对 象 (垃圾 ) 越 多 ， 区 域 的 转移 效率 就 
越 高 ， 因 此 G1GC 会 优先 选择 垃圾 多 的 区 域 进 入 回收 集合 。 这 就 是 
G1GC 名 称 的 由 来 。 
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< 形 甬 | 步骤 2 一 根 转移 
根 转移 的 转移 对 象 包括 以 下 3 类 。 


QD 由 根 直 接 引 用 的 对 象 
@) 并 发 标记 处 理 中 的 对 象 
@) 由 其 他 区 域 对 象 直接 引用 的 回收 集合 内 的 对 象 











根 转 移 的 伪 代 码 如 代码 清单 3.2 所 示 。 


代码 清单 3.2 evacuate_roots() 函数 


1: def evacuate roots(): 


2 上 GT 

3 EECEESIIEEETCTSe 全 下 

4: vacuatesod) 

汪汪 

6: force _ update rs() 

3 FEoreEneeqrenmnngceoiecEncnSSLE 

8 Eormeand me eo lon eeandss 

9 scan card (card) 

Oe 

ef ecanmeargdl(lcarg 

2 Roreobm mobnetsm cand(eande: 
了 PEETSEmansedilleoojl 下 

14: Eer en ee len (oe 

1 TFNntoneollectronloet (en 
6 *child = evacuate obj (child) 














转移 专用 记忆 集合 中 记录 了 区 域 之 间 完 整 的 对 象 引用 关系 ， 但 没有 
记录 来 自 根 的 引用 。 因 此 ， 代 码 清单 3.2 的 第 2 行 至 第 4 行 先是 把 被 根 
引用 的 位 于 回收 集合 内 的 对 象 转移 到 其 他 的 空闲 区 域 。 被 根 引用 却 不 在 
回收 集合 内 的 对 象 会 被 直接 忽略 。 第 4 行 的 evacuate_obj () 是 用 于 转 
移 对 象 的 函数 ， 它 的 返回 值 是 转移 后 对 象 的 地 址 。3.8.1 节 将 对 此 进行 详 
细 介 绍 。 

另外 ， 并 发 标记 中 使 用 的 SATB 本 地 队列 和 SATB 队列 集合 中 的 引 
用 也 包含 在 $root 中 ， 会 被 转移 。 这 是 因为 它们 的 引用 地 址 都 必须 改 为 
转移 后 的 地 址 。 

第 6 行 中 force_update_rs() 的 作用 是 将 未 被 转移 专用 记忆 集合 
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维护 线程 扫描 的 脏 卡 片 更 新 到 转移 专用 记忆 集合 中 。 具 体 来 说 ， 包 含 如 
下 3 个 部 分 涉及 的 脏 卡 片 。 


J 各 个 mutator 线程 的 转移 专用 记忆 集合 日 志 
@ 转移 专用 记忆 集合 日 志 的 集合 
@) 热 卡片 





正如 3.4 节 所 说 ， 转 移 专用 记忆 集合 的 更 新 是 并 发 进行 的 。 在 转移 
开始 时 ， 转 移 专 用 记忆 集合 维护 线程 的 处 理 很 可 能 还 没 结 束 ， 因 此 有 必 
要 将 中 和 @) 中 的 脏 卡 片 更 新 到 转移 专用 记忆 集合 中 。 

通过 第 7 行 至 第 9 行 ， 回 收集 合 内 被 其 他 区 域 引用 的 对 象 会 像 根 一 
样 被 转移 。 第 7 行 的 Scollection set 是 回收 集合 。 第 8 行 的 rs_ 
cards 域 中 保存 了 区 域 的 转移 专用 记忆 集合 中 的 所 有 卡片 。 第 9 行 的 
scan_card() 函数 的 函数 体 是 第 11 行 至 第 16 行 。 这 个 函数 所 做 的 事情 
是 扫描 转移 专用 记忆 集合 中 的 卡片 所 对 应 的 每 个 对 象 。 如 果 某 对 象 存在 
回收 集合 内 对 象 的 引用 ， 那 么 该 对 象 也 会 被 转移 。 需 要 注意 的 是 ， 如 
果 卡 片 中 的 对 象 是 未 被 标记 的 ， 那 么 其 子 对 象 将 不 会 继续 被 扫描 。 
























































> 








3.8.1 ”对 和 象 转移 


接 下 来 我 们 介绍 一 下 3.8 节 中 略 过 的 对 象 转移 。 图 3.7 展示 了 一 个 
简单 的 例子 。 
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转移 队列 
加 [ 
转移 对 象 转移 目标 区 域 


转移 对 象 转移 目标 区 域 








回收 集合 内 






























































































































































(回收 集合 内 ) 
转移 目标 区 域 
@ 回 ”引用 方 © 
dfieldl | 、 引用 方 
转移 专用 记忆 集合 d.fieldl 
aTieldy 
卡片 
a . 9 L 
转移 目标 区 域 可 收集 合 外 译 二 区 轴 
回收 集合 内 。 “| 回收 集合 外 转移 目标 区 域 人 


























图 3.7 对 象 转移 





QD 是 将 对 象 a 转移 到 空闲 区 域 。 





@) 是 将 对 象 a 在 空闲 区 域 中 的 新 地 址 写 和 到 转移 前 所 在 区 域 中 的 旧 








位 置 。 保 存在 旧 位 置 的 这 个 新 地 址 称 为 forwarding 指针 “。 








(是 将 对 象 a 引用 的 所 有 位 于 回收 集合 内 的 对 象 都 添加 到 转移 队列 











中 。 转 移 队列 用 来 临时 保存 待 转移 对 象 的 引用 方 。 图 中 a'.fieldl 引用 了 


对 象 b， 而 且 b 所 在 的 区 域 在 回收 集合 中 。 因 为 a' 是 存活 对 象 ， 所 以 a 











引用 的 对 象 b 也 是 存活 对 象 。 这 样 一 来 ， 对 象 b 就 成 了 回收 集合 中 的 
( 待 转移 ) 对 象 ， 它 的 引用 方 a'.field1 会 被 添加 到 转移 队列 中 。 之 所 以 往 




















转移 队列 中 添加 a'.field1l 而 不 是 b， 是 因为 我 们 必须 要 在 转移 完 
将 新 的 地 址 写 人 到 a.fieldl 中 。 








b 之 后 


(是 针对 对 象 a 引用 的 位 于 回收 集合 外 的 对 象 ， 更 新 转移 专用 记忆 
合 。 图 中 a.field2 引用 了 对 象 c<， 而 c 所 在 的 区 域 不 在 回收 集合 中 。e 














所 在 区 域 的 转移 专用 记忆 集合 中 虽然 记录 了 a.field2 对 应 的 卡片 ， 
被 转移 到 了 a'， 所 以 有 必要 更 新 转移 专用 记忆 集合 。 如 图 中 








Q@ 保存 转移 后 新 地 址 的 变量 。 一 旦 发 现 了 指向 转移 前 地 址 的 指针 ， 就 能 将 其 
向 转移 后 的 新 地 址 。 


但 是 a 


所 示 ， 


改 为 指 
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a'.field2 对 应 的 卡片 被 添加 到 了 c 所 在 区 域 的 转移 专用 记忆 集合 中 。 

名 是 针对 对 象 a 的 引用 方 ， 更 新 转移 专用 记忆 集合 。 对 象 转移 时 只 
有 1 个 引用 方 能 够 以 参数 的 形式 进行 传递 。 图 中 a 的 引用 方 是 d.fieldl 。 
d.fieldl 指向 的 是 a 的 地 址 ， 但 是 a 被 转移 到 了 a， 所 以 有 必要 让 d.field1 
指向 a 的 地 址 。 如 图 中 所 示 ，d.fieldl 对 应 的 卡片 被 添加 到 了 a' 所 在 区 
域 的 转移 专用 记忆 集合 中 。 

人 @@ 这 一 步 并 非 转移 的 处 理 内 容 ， 只 是 补充 说 明 。 对 象 转 移 最 终 返 回 
的 是 转移 后 的 地 址 。 在 调用 转移 的 地 方 ， 返 回 的 地 址 会 被 赋值 给 引用 方 
(代码 清单 3.2 中 第 4 行 和 第 16 行 )。 图 中 dfieldl 的 地 址 被 替换 成 了 对 
象 a 的 地 址 。 

为 了 更 清晰 地 理解 这 一 过 程 ， 我 们 一 起 来 看 一 看 对 象 转移 的 伪 代 但 
(代码 清单 3.3 )。 
代码 清单 3.3 ”evacuate_obj() 函数 


1: def evacuate obj (ref): 
fom = ef 

B PF no smarked(E om) 
4 return from 

5 if from.forwarded: 
6 

7 

8 

9 












































aqomehenenece reriomeh on waneee 
return from.forwarding 


ES EUSSEESLSEESS SG Eom) 





ommeopy data lmnew ome om ee 

LL 

orom torwandino to 

1 EomeEornwarded = Tue 

14: 

dS orachl ne nd en 

M6: Wen omeollcct ron ea cml 
I enqueue ($evacuate queue, child) 
eB Gesen 

108 adomreferencelenanlo en 
Bn 

2 ference 

2 


233 “etnmrn to 


参数 ref 是 待 转 移 对 象 的 引用 方 。 第 2 行 的 from 是 待 转 移 对 象 。 
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第 3 行 和 第 4 行 是 取消 未 标记 对 象 的 转移 ， 直 接 返 回 。 而 死亡 对 象 
无 论 什么 时 候 都 不 会 被 转移 。 

第 5 行 至 第 7 行 则 是 在 对 象 已 经 被 转移 时 返回 转移 后 的 地 址 。 第 6 
行 的 函数 add_reference (from，to) ， 其 作用 是 将 from 对 应 的 卡片 添 
加 到 to 所 在 区 域 的 转移 专用 记忆 集合 中 (后面 会 详细 介绍 )。 具 体 到 这 
段 代码 中 ,含义 就 是 将 引用 方 对 应 的 卡片 添加 到 转移 目标 ( forwarding 
指针 ) 区 域 的 转移 专用 记忆 集合 中 ( 和 图 3.7 中 的 @@ 作 用 相同 )。 

第 9 行 和 第 10 行 用 来 将 对 象 复制 到 转移 目标 区 域 (图 3.7 中 的 
@); 第 12 行 和 第 13 行 用 于 将 对 象 转移 后 的 地 址 存 和 人 forwarding 指针 
中 (图 3.7 中 的 @ )。 

第 15 行 至 第 19 行 用 来 扫描 已 转移 完成 的 对 象 的 子 对 象 。 第 16 行 
用 来 检查 子 对 象 是 否 在 回收 集合 内 。 如 果 在 回收 集合 内 ， 则 执行 第 17 
行 ， 将 子 对 象 添加 到 转移 队列 ( $Sevacuate_queue) 中 (图 3.7 中 的 
@) )， 否 则 执行 第 19 行 ， 调 用 函数 add_reference () 。 该 函数 的 参数 为 
子 对 象 的 引用 方 child 和 子 对 象 *child (图 3.7 中 的 @ )。 

第 21 行 用 来 将 待 转移 对 象 所 对 应 的 卡片 ， 添 加 到 转移 目标 区 域 的 
转移 专用 记忆 集合 中 (图 3.7 中 人 @ )。 然 后 ， 通 过 第 23 行 返回 对 象 转移 
后 的 新 地 址 (图 3.7 的 @ )。 

接 下 来 ,我 们 看 一 下 函数 adg_reference() 的 伪 代 码 (代码 清单 
3.4 )。 该 函数 的 作用 是 向 转移 专用 记忆 集合 中 添加 引用 方 所 对 应 的 卡片 。 
代码 清单 3.4 add_reference() 函数 


人 EddRaeREREREELEEEONREEOE 

















































































































名 to region = region (to) 

3 Eromlne ten neonon (Een 

4: PEEoRreglioneu Nunnd romegion No on 

3 to region != from region and not is into collection set (from): 
6 pushl(cardl(freom) tonregion rs ecards) 





参数 from 是 引用 方 的 地 址 ，to 是 引用 对 象 的 地 址 。 第 2 行 和 第 3 
行 分 别 用 来 获取 各 自 的 区 域 。 如 果 传 递 给 函数 region () 的 地 址 是 堆 外 
的 地 址 ， 该 函数 会 返回 Nul1。 

第 4 行 分 别 检查 to_region 和 from region 是 否 为 Null。 第 5 行 
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检查 to _region 和 from region 是 否 位 于 不 同 的 区 域 。 如 果 二 者 位 于 
相同 的 区 域 ， 就 没有 必要 将 卡片 添加 到 转移 专用 记忆 集合 中 了 。 

同时 ， 第 5 行 还 检查 from 是 否 在 回收 集合 之 外 。 如 果 from 在 回收 
集合 之 内 ， 那 么 它 要 么 已 经 转移 完成 ， 要 么 马上 就 要 被 转移 ， 所 以 都 可 
以 忽略 掉 。 

这 几 步 检查 都 通过 之 后 ， 就 在 第 6 行 由 也 数 card () 获取 from 所 
对 应 的 卡片 ， 然 后 将 其 添加 到 区 域 co_region 的 转移 专用 记忆 集合 中 。 


于, 放 步骤 G3 盖 一 转移 


完成 根 转移 之 后 ， 那 些 被 转移 队列 引用 的 对 象 将 会 依次 转移 。 直 到 
转移 队列 被 清空 ， 转 移 就 完成 了 。 至 此 ， 回 收集 合 内 的 所 有 存活 对 象 都 
被 成 功 转移 了 〈 代码 清单 3.5 )。 


代码 清单 3.5 evacuate() 函数 


1: def evacuate () : 









































2 while sevacuate queue LE Null: 
BE ref "="dequeue ($evacuate queue) 
4: ref eacuUateEcbjlleetl 








最 后 ， 清 空 回收 集合 的 记忆 集合 ， 开 局 mutator 的 执行 。 


< 天 【 怖 标记 信息 的 作用 


3.8.1 节 代 码 清单 3.3 的 第 3 行 和 第 4 行 ，3.8 节 代 码 清单 3.2 的 第 
13 行 都 会 判断 对 象 是 否 被 标记 ， 进 而 忽略 掉 死 亡 对 象 。 因 为 有 这 些 处 
理 ， 所 以 像 图 3.8 中 b 这 样 只 被 死亡 对 象 引 用 的 对 象 是 不 会 被 转移 的 。 
这 正 是 并 发 标记 中 标记 信息 的 意义 所 在 。 
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转移 目标 区 











区 域 A 区 域 B 区 域 C 区 域 D 














图 3.8 标记 信息 的 意义 


待 转移 对 象 所 在 区 域内 的 对 象 b， 因 为 只 被 死亡 对 象 引 用 ， 所 以 不 会 被 转 
移 。 只 有 对 象 d 会 被 转移 。 








转移 专用 记忆 集合 也 在 不 停 地 记录 着 来 自 死亡 对 象 的 引用 。 查 看 并 
发 标记 的 标记 信息 ， 有 助 于 忽略 来 自转 移 专用 记忆 集合 中 死亡 对 象 的 引 
用 ， 也 有 助 于 更 多 地 发 现 区 域内 的 死亡 对 象 。 


在 转移 过 程 中 ， 需 要 选择 适当 数量 的 区 域 组 成 回收 集合 ， 然 后 将 回 
收集 合 内 的 存活 对 象 转移 到 空 亲 区域。 转移 时 需要 扫描 转移 专用 记忆 集 
合 和 根 。 如 果 转 移 时 有 并 发 标记 的 标记 信息 可 供 参 考 ， 更 有 助 于 正确 地 
发 现存 活 对 象 。 

另外 ， 如 果 能 知道 并 发 标记 之 后 存活 对 象 的 数量 ， 那 么 选择 回收 集 
合 时 用 到 的 转移 预测 暂停 时 间 会 更 加 精准 。 关 于 详细 内 容 ， 我 们 将 在 
4.2 节 中 介绍 。 
































本 章 将 介绍 G1GC 是 如 何 实现 软 实时 性 的 。 


区 用 户 的 需求 











在 G1GC 中 ， 用 户 可 以 设置 如 下 3 个 值 。 








GD 可 用 内 存 上 限 
@) GC 暂停 时 间 上 限 
G@) GC 单位 时 间 





设置 四 是 为 了 避免 内 存 被 过 度 占 用 。 就 算是 为 了 实现 软 实时 性 ， 也 
不 能 让 GC 完全 占用 内 存 。 

@) 指 定 的 是 执行 GC 所 导致 的 mutator 的 最 大 和 暂停 时 间 。 这 个 最 大 
和 暂停 时 间 并 不 包含 G1GC 的 并 发 处 理 时 间 。 在 多 处 理 器 环境 下 ，G1GC 
的 并 发 处 理 时 间 可 以 理解 成 平均 分 配给 mutator 的 负载 。 

有 一 个 权宜 之 计 可 以 避免 GC 暂停 时 间 超过 指定 上 限 ， 那 就 是 频繁 
地 执行 暂停 时 间 较 短 的 GC。 虽 然 这 样 做 确实 可 以 缩短 GC 暂停 时 间 ， 
但 是 mutator 的 执行 也 会 频繁 地 被 GC 打 断 ， 从 而 导致 mutator 几乎 无 法 
正常 执行 。 要 想 避 免 这 个 问题 ， 需 要 指定 @@ 的 GC 单位 时 间 。 指 定 该 项 
后 ，G1GC 将 在 每 个 单位 时 间 内 遵守 GC 的 暂停 时 间 上 限 。 如 果 GC 暂 
停 时 间 上 限 是 1 秒 ， 而 GC 单位 时 间 是 3 秒 ， 就 意味 着 在 任意 3 秒 的 时 
间 段 内 ，GC 的 暂停 时 间 不 可 以 超过 1 秒 (图 4.1)。 





















































mutator 处 理 ， 和 
GC 单位 
/A 时 间 

GC 暂停 处 理 | 一 -一 > > | —p>— eld 








a 的 暂停 时 间 b 的 暂停 时 间 ”。 的 暂停 时 间 d 的 暂停 时 间 
GC 暂停 > 
时 间 上 限 | real | 本 
OK OK NG OK 
图 4.1 GC 单位 时 间 内 的 GC 暂停 时 间 上 限 
a、b、c、d 分 别 代表 一 个 GC 单位 时 间 ，GC 只 在 c 中 超过 了 暂停 时 间 上 限 。 





G1GC 会 努力 实现 软 实时 性 。 软 实时 性 的 定义 是 GC 单位 时 间 内 
GC 暂停 时 间 超 过 上 限 的 次 数 在 用 户 的 容忍 范围 之 内 。 因 此 ， 尽 管 在 图 
4.1 中 ，GC 单位 时 间 e 内 的 GC 暂停 时 间 超 过 了 上 限 , 但 是 只 要 用 户 认 
为 可 以 接受 ,就 算是 实现 了 软 实时 性 。 


区 预测 转移 时 间 


要 想 在 GC 暂停 时 间 上 限 之 内 完成 转移 ， 就 需要 选择 可 以 在 这 个 时 
间 范 围 内 完成 转移 的 回收 集合 ( 参考 3.7 节 )。 在 往 回 收集 合 中 添加 区 域 
时 ， 要 先 预测 一 下 该 区 域 的 转移 时 间 ， 如 果 超 过 了 GC 暂停 时 间 上 限 ， 
就 不 再 添加 该 区 域 ， 并 终止 回收 集合 的 选择 。 

在 G1GC 中 , 由 GC 导致 的 mutator 的 暂停 时 间 称 为 消耗 。 转 移 回 
收集 合 的 消耗 ， 等 于 扫描 转移 专用 记忆 集合 中 的 卡片 时 的 消耗 与 对 象 转 
移 时 的 消耗 之 和 。 具 体 公式 如 下 所 示 。 









































V(cs)=Vis +U:d+ (SrsSize(r)+C.liveBytes(r)) 
公式 中 各 个 数值 的 含义 如 下 。 


e cs: 回收 集合 
e@ Vlcs): 转移 回收 集合 (cs ) 的 消耗 








e Vw : 固定 消耗 

e U: 扫描 脏 卡 片 的 平均 消耗 

e d: 转移 开始 时 的 脏 卡片 数 

e 9: 查找 卡片 内 指向 回收 集合 的 引 
er: 区 域 
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] 的 消耗 








e@ rsSize: 区 域 的 转移 专用 记忆 集合 











! 的 卡片 总 数 





e C: 对 象 转移 时 ( 每 个 字 节 ) 的 消耗 
e liveBytes: 区 域内 存活 对 象 的 总 字 节 数 ( 大 概 的 值 ) 


Vlcs) 表示 某 个 回收 集合 ( cs ) 的 转移 时 间 。Viws 表示 转移 过 程 中 的 
固定 消耗 ， 主 要 是 选择 和 释放 回收 集合 时 的 消耗 。 

有 sa、UV、S、C 这儿 个 值 的 大 小 受 实现 方法 、 运 行 平台 以 及 应 用 程 
序 特 性 等 各 种 环境 因素 的 影响 ， 是 可 变 的 。 因 此 可 以 先 根据 经 验 设置 一 
些 初 始 值 ， 再 通过 测量 各 自 的 实际 处 理 时 间 来 进行 修正 ， 以 提高 精度 。 

















liveBytes 使 用 2.7 节 中 设置 过 的 值 。 











对 于 在 并 发 标记 结束 后 被 分 配 





( allocated ) 的 对 象 ， 即 使 是 死亡 对 象 ， 也 要 将 其 当 作 存活 对 象 来 计数 。 
因此 liveBytes 并 非 精 确 值 ， 只 是 大 概 的 值 。 
理解 了 各 个 变量 的 值 之 后 ， 公 式 的 含义 就 简单 易 懂 了 。S .rsSize( 门 + 

















C: liveBytes(r) 是 一 个 区 域 的 转移 消耗 。 


》 (.) 是 回收 集合 内 所 有 区 域 





的 转移 消耗 的 总 和 。V jd 是 对 3.8 节 中 介绍 的 剩余 脏 卡片 进行 扫描 的 消 
耗 。 这 些 消耗 再 加 上 Vs， 就 是 总 体 的 消耗 了 。 


5 素 省 预测 可 信和 度 








用 户 可 以 通过 对 消耗 的 预测 值 设 置 预测 可 信和 度 来 调整 暂停 时 间 。 





预测 可 信 度 是 一 个 百分数 。 如 果 预 测 可 信 度 设置 为 120%，GC 暂停 
时 间 会 在 消耗 预测 值 的 基础 上 上 浮 20%。 相 反 ， 如 果 设 置 为 80%， 会 在 
预测 值 的 基础 上 下 浮 20%。 预 测 可 信 度 越 高 ，mutator 的 暂停 时 间 就 越 
短 ; 相反 ， 预 测 可 信和 度 越 低 ，mutator 的 暂停 时 间 就 越 长 。 





“ 素 量 明 GC 暂停 处 理 的 调度 


GC 暂停 处 理 必 须 在 合适 的 时 机 进行 。 这 是 为 了 遵守 4.1 节 中 提 到 
的 规则 : 在 GC 单位 时 间 内 不 得 超过 GC 暂停 时 间 的 上 限 。 

当 堆 内 空间 充足 时 ， 可 以 根据 需要 扩展 堆 ， 从 而 延迟 转移 处 理 。 而 
且 ， 转 移 处 理 并 不 一 定 发 生 在 并 发 标记 完全 结束 之 后 。 因 此 ， 即 使 并 发 
标记 过 程 中 的 暂停 处 理 ( 根 扫描 等 ) 延迟 开始 ， 也 不 会 产生 致命 的 问 
题 。 通 过 这 些 可 知 : 在 一 般 情 况 下 (除了 堆 内 空间 紧缺 时 )，GC 暂停 处 
理发 生 的 时 机 是 可 以 调度 的 。 

G1GC 中 有 一 个 队列 名 为 调度 队列 ， 其 中 的 元 素 是 暂停 处 理 的 开始 
时 间 和 结束 时 间 的 组 合 。G1GC 使 用 这 个 队列 来 高 效 地 调度 GC 的 暂停 
处 理 任务 。 调 度 队 列 中 保存 了 最 近 一 次 暂停 处 理 的 开始 时 间 和 结束 时 间 
( 队列 的 元 素 )。 调 度 队 列 中 元 素 个 数 是 有 上 限 的 ， 如 果 添 加 元 素 时 超过 
上 限 ， 队 列 头 部 中 最 早 添 加 的 元 素 就 会 被 删除 。 

调度 程序 会 基于 调度 队列 中 的 信息 来 决定 下 次 GC 暂停 的 适当 时 

。 请 看 下 面 的 图 4.2。 
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图 4.2 GC 暂停 处 理 的 调度 


如 果 像 图 中 国 这 样 执行 ，GC 单位 时 间 内 总 的 GC 暂停 时 间 会 超过 上 限 。 
但 是 如 果 像 国 这 样 指定 了 合适 的 GC 暂停 时 机 Z，GC 单位 时 间 内 总 的 GC 
暂停 时 间 就 不 会 超过 上 限 了 。 
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图 4.2 中 由 的 X 表 示 下 次 GC 暂停 处 理 的 预测 暂停 时 间 。 调 度 程序 
会 计算 X 的 开始 时 刻 。 
首先 ， 假 定 X 会 像 图 中 四 一样 立即 开始 执行 ， 由 此 计算 出 GC 单位 
时 间 内 总 的 GC 暂停 时 间 (包含 X)， 并 检查 它 是 否 超过 用 户 指 定 的 GC 
暂停 时 间 上 限 。 如 果 没 有 超过 上 限 ， 则 认为 X 可 以 立即 开始 执行 ， 相 
反 ， 如 果 超 过 了 上 限 ， 则 需要 延迟 执行 X。GC 暂停 时 间 上 限 和 总 的 GC 
暂停 时 间 的 差 用 YY 来 表示 。 

图 中 图 将 X 的 开始 时 刻 向 后 延迟 了 Y， 延 迟 后 的 开始 时 刻 用 Z 表 
示 。 这 样 ，GC 单位 时 间 内 总 的 GC 暂停 时 间 就 刚好 等 于 GC 暂停 时 间 
上 限 。 换 名 话说 ，Z 就 是 执行 X 的 合适 时 机 。 

需要 注意 的 是 ， 调 度 程序 会 保证 在 任意 选取 的 GC 单位 时 间 内 ， 

的 GC 暂停 时 间 不 会 超过 用 户 指 定 的 GC 暂停 时 间 上 限 。 pe 
时 间 是 3 秒 ，GC 暂停 时 间 上 限 是 1 秒 ， 那 么 就 要 像 “第 0 秒 到 第 3 秒 
ead Abi “第 0.0001 秒 到 第 3.0001 秒 内 的 GC 和 暂 
停 时 间 不 超过 1 秒 ”“ 第 0.0003 秒 到 第 3.0002 秒 内 的 GC 暂停 时 间 不 超 
过 1 秒 ” 这 些 情 况 一 样 ， 在 无 论 从 哪个 时 刻 开始 的 3 秒 内 ，GC 暂停 时 
间 都 不 会 超过 上 限 哪 怕 1 秒 。 图 4.3 展示 了 实际 发 生 过 的 GC 暂停 的 时 
间 片 段 。 


a b C 
GC 暂停 处 理 a 有 


四 a 的 暂停 时 间 b 的 暂停 时 间 c 的 暂停 时 间 
GC 暂停 -一 
时 间 上 限 ”下 一 AH 一 










































































4.3 ”GC 单位 时 间 内 总 的 GC 暂停 时 间 
GC 单位 时 间 a、b、c 中 任何 一 个 的 总 GC 暂停 时 间 都 不 超过 暂停 时 间 上 限 。 


观察 一 下 GC 单位 时 间 a、b、c 范围 内 总 的 GC 暂停 时 间 ， 可 以 发 
现 GC 暂停 处 理 的 确 没有 超过 GC 暂停 时 间 上 限 。 

当然 ,在 GC 的 预测 时 间 不 准确 或 堆 内 空间 不 足 等 导致 GC 必须 提 
前 开始 时 ，GC 暂停 处 理 还 是 会 超出 暂停 时 间 上 限 。 








并 发 标记 中 的 暂停 处 理 


并 发 标记 中 的 暂停 处 理 阶段 也 会 以 4.4 节 中 的 方法 按照 合适 的 间隔 
执行 。 具 体 来 说 ,需要 在 以 下 3 个 步骤 中 执行 暂停 处 理 。 

















GD 初始 标记 阶段 (参考 2.4 节 ) 
@) 最 终 标记 阶段 (参考 2.6 节 ) 
@ 收尾 工作 (参考 2.8 市) 

















但 是 ， 这 些 步骤 的 暂停 时 间 不 像 转移 中 的 暂停 时 间 一 样 可 控 ， 如 果 
暂停 时 间 本 身 就 超过 了 GC 暂停 时 间 上 限 ， 就 不 能 遵守 GC 暂停 时 间 上 
限 了 。 

在 调度 GC 的 暂停 时 机 时 ， 需 要 预测 暂停 时 间 。 一 开始 需要 根据 经 
验 来 设置 并 发 标记 中 和 暂停 处 理 的 预测 暂停 时 间 。 然 后 可 以 根据 测算 出 的 
实际 暂停 时 间 ， 并 结合 过 去 的 执行 结果 来 提高 预测 暂停 时 间 的 精确 度 。 




















G1GC 中 存在 “ 纯 G1GC 模式 ”( pure garbage-first mode ) 和 “分 代 
G1GC 模式 ”( generational garbage-first mode ) 两 种 模式 。 前 面 介绍 的 内 
容 都 是 关于 纯 G1GC 模式 的 。 本 章 ， 我 们 将 介绍 分 代 G1GC 模式 。 

本 书 之 所 以 先 介绍 纯 G1GC 模式 ， 是 为 了 便于 大 家 理解 。 实 际 上 ， 
OpenJDK 虽然 实现 了 纯 G1GC 模式 ， 但 是 并 没有 将 这 种 模式 开放 给 用 











户 。 用 户 们 使 用 的 都 是 分 代 G1GC 模式 。 


和 纯 G1GC 模式 相 比 ， 分 代 G1GC 模式 主要 有 以 下 两 个 不 同 点 。 











e 区 域 是 分 代 的 
e 回收 集合 的 选择 是 分 代 的 











在 分 代 G1GC 模式 中 ， 区 域 被 分 为 新 生 代 区 域 和 老年 代 区 域 两 类 。 
和 其 他 分 代 GC? 算 法 一 样 , 分 代 G1GC 的 对 象 也 保存 了 自身 在 各 次 转移 
中 存活 下 来 的 次 数 。 新 生 代 区 域 用 来 存放 新 生 代 对 象 ， 老 年 代 区 域 用 来 
存放 老年 代 对 象 。 

另外 , 分 代 G1GC 模式 也 分 为 新 生 代 GC” 和 老年 代 GC"。G1GC 中 
的 新 生 代 GC 称 为 完全 新 生 代 GC ( fully-young collection )， 老 年 代 GC 




















中 分 代 GC : 通过 给 对 象 引 入 “年 龄 ”的 概念 来 提升 GC 效率 的 算法 。 
@) 新 生 代 GC: minor GC， 分 代 GC 中 针对 新 生 代 对 象 的 垃圾 回收 。 
@ 老年 代 GC : major GC， 分 代 GC 中 针对 老年 代 对 象 的 垃圾 回收 。 
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称 为 部 分 新 生 代 GC ( partially-young collection )。 关 于 这 两 个 名 字 的 由 
来 ,我 们 将 在 5.6 节 中 介绍 。 

完全 新 生 代 GC 和 部 分 新 生 代 GC 的 主要 区 别 在 于 回收 集合 的 选择 。 
完全 新 生 代 GC 将 所 有 新 生 代 区 域 选 入 回收 集合 ， 而 部 分 新 生 代 GC 将 
所 有 新 生 代 区 域 ， 以 及 一 部 分 老年 代 区 域 选 入 回收 集合 。 

这 里 需要 注意 的 是 ， 所 有 的 新 生 代 区 域 都 会 被 选 入 回收 集合 。 这 一 
点 非常 重要 ， 请 务必 牢记 。 


瑟 4 新 生 代 区 域 


新 生 代 区 域 可 以 进一步 分 为 以 下 两 类 。 


























e@ 创建 区 域 
e 存活 区 域 


创建 区 域 用 来 存放 刚刚 生成 、 一 次 也 没有 被 转移 过 的 对 象 。 存 活 区 
域 用 来 存放 被 转移 过 至 少 一 次 的 对 象 。 
另外 ， 转 移 专 用 写 屏 障 不 会 应 用 在 新 生 代 区 域 的 对 象 上 。 因 此 ， 即 
使 新 生 代 区 域 的 对 象 存在 对 其 他 区 域 对 象 的 引用 ,被 引用 区 域 的 转移 专 


用 记忆 集合 中 也 不 会 记录 引用 方 的 卡片 (图 5.1 )。 


写 屏障 有 效 












































转移 专用 记忆 集合 A 转移 专用 记忆 集合 B 























写 屏 障 无 效 












































区 域 A ( 新生 代 ) 区 域 B ( 老年 代 ) 区 域 A ( 新生 代 ) 区 域 B ( 老年 代 ) 








图 5.1 新 生 代 区 域 和 转移 专用 写 屏障 
对 于 新 生 代 区 域 A 中 对 象 a 对 老年 代 区 域 B 中 对 象 b 的 引用 ,转移 专用 
写 屏 障 是 无 效 的 ， 所 以 转移 专用 记忆 集合 BB 不 会 记录 这 次 引用 ( 左 图 )。 
而 对 于 来 自 老年 代 区 域 对 象 的 引用 ， 转 移 专 用 写 屏 障 仍然 有 效 ( 右 图 )。 
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但 是 ， 为 什么 不 使 用 转移 专用 写 屏 障 也 可 以 呢 ? 我 们 先 回顾 一 下 转 
移 专用 记忆 集合 的 作用 。 转 移 专用 记忆 集合 维护 的 是 区 域 之 间 的 引用 关 
系 ， 因 此 在 转移 时 无 须 扫描 整个 区 域 就 能 找到 竺 转移 对 象 所 在 区 域 的 存 
活 对 象 。 而 在 分 代 G1GC 模式 中 ， 所 有 的 新 生 代 区 域 都 会 被 选 人 回收 集 
合 ， 因 此 在 转移 新 生 代 区 域 时 所 有 对 象 的 引用 都 会 被 检查 。 即 使 被 引用 
区 域 的 转移 专用 记忆 集合 中 记录 了 来 自 新 生 代 区 域 的 引用 ,这些 记录 也 
都 是 重复 的 信息 。 因 此 ， 转 移 专 用 记忆 集合 中 不 会 记录 来 自 新 生 代 区 域 
的 引用 。 


:下放 分 代 对 象 转移 


存活 对 象 保存 了 自己 被 转移 的 次 数 ， 这 个 次 数 称 为 对 象 的 年 龄 。 转 
移 时 对 象 的 年 龄 如 果 低 于 阔 值 ， 对 象 就 会 被 转移 到 存活 区 域 ， 和 否则 就 会 
被 转移 到 老年 代 区 域 。 将 对 象 转移 到 老年 代 区 域 的 行为 称 为 晋升 。 

如 果 转 移 的 目标 区 域 满 了 ， 垃 圾 回收 带 就 会 选择 一 个 空闲 的 区 域 ， 
把 它 修 改 成 存活 区 域 或 者 老年 代 区 域 之 后 ， 作 为 转移 的 目标 区 域 使 用 。 

对 象 被 转移 到 存活 区 域 之 后 ， 即 使 该 对 象 引 用 了 回收 集合 以 外 的 区 
域 ， 也 不 需要 记录 在 转移 专用 记忆 集合 中 。 关 于 这 一 点 的 原因 ，5.2 节 
的 后 半 部 分 已 经 介绍 过 了 。 相 反 ， 往 老年 代 区 域 转移 对 象 时 就 必须 要 记 
录 。 因 为 老年 代 区 域 并 非 每 次 都 会 被 选 人 回收 集合 。 


帝 旨 执行 过 程 简 述 


我 们 来 看 一 下 完全 新 生 代 GC 的 执行 过 程 。 

完全 新 生 代 GC 不 会 选择 老年 代 区 域 ， 而 是 将 所 有 新 生 代 区 域 都 选 
入 回收 集合 ， 然 后 转移 回收 集合 内 的 存活 对 象 。 晋 升 的 对 象 会 被 转移 到 
老年 代 区 域 ， 其 余 对 象 则 被 转移 到 存活 区 域 (图 5.2 )。 
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图 5.2 完全 新 生 代 GC 的 执行 过 程 简 述 
只 有 新 生 代 区 域 会 被 选 入 回收 集合 ， 老 年 代 区 域 则 不 会 被 选 入 。 





部 分 新 生 代 GC 则 是 除了 所 有 新 生 代 区 域外 ， 还 会 选择 一 部 分 老年 
代 区 域 进入 回收 集合 。 除 了 回收 集合 的 选择 方式 ， 部 分 新 生 代 GC 和 完 
全 新 生 代 GC 的 执行 过 程 是 一 样 的 (图 5.3 )。 
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图 5.3 部 分 新 生 代 GC 的 执行 过 程 简 述 
所 有 新 生 代 区 域 和 一 部 分 老年 代 区 域 会 被 选 入 回收 集合 。 
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让 和 分 代 选 择 回收 集合 


刚才 介绍 过 ， 在 回收 集合 的 选择 方式 上 ， 完 全 新 生 代 GC 和 部 分 新 
生 代 GC 有 所 不 同 。 完 全 新 生 代 GC 会 选择 所 有 新 生 代 区 域 ， 而 部 分 新 
生 代 GC 会 选择 所 有 新 生 代 区 域 和 一 部 分 老年 代 区 域 。 

分 代 GC 的 理论 基础 是 大 多 数 对 象 是 “ 朝 生 夕 死 ” 的 。 因 此 ， 分 代 
G1GC 模式 也 是 通过 选择 回收 集合 的 方式 来 确保 总 是 优先 转移 新 生 代 区 
域 ， 从 而 积极 地 释放 年 轻 对 象 的 内 存 空 间 。 

不 过 ， 选 择 全 部 新 生 代 区 域 的 做 法 可 能 会 打破 软 实时 性 。 如 果 新 生 代 
区 域 数 太 多 ， 就 有 可 能 无 法 遵守 用 户 设置 的 GC 暂停 时 间 上 限 。 要 想 避 
免 这 个 问题 ， 分 代 G1GC 模式 就 需要 计算 出 合理 的 最 大 新 生 代 区 域 数 。 


下 设置 最 大 新 生 代 区 域 数 


完全 新 生 代 GC 和 部 分 新 生 代 GC 关于 最 大 新 生 代 区 域 数 的 计算 方 
法 是 不 一 样 的 。 

完全 新 生 代 GC 的 最 大 新 生 代 区 域 数 是 在 遵守 GC 暂停 时 间 上 限 的 
前 提 下 ,尽量 设置 较 大 的 值 。 即 根据 过 去 的 转移 时 间 记 录 ， 预 测 出 单个 
新 生 代 区 域 转移 所 需 的 大 概 时 间 ， 然 后 基于 这 个 时 间 计算 出 刚好 不 超过 
GC 暂停 时 间 上 限 的 最 大 新 生 代 区 域 数 。 完 全 新 生 代 GC 的 名 字 由 来 就 
是 “ 尽 可 能 完全 地 转移 新 生 代 区 域 ”。 

而 部 分 新 生 代 GC 的 最 大 新 生 代 区 域 数 是 在 遵守 GC 单位 时 间 的 前 
提 下 ， 尽 量 设置 较 小 的 值 。 首 先 ， 采 用 4.4 方 中 介绍 的 方法 计算 出 下 次 
能 够 进行 GC 暂停 处 理 的 时 机 。 然 后 ， 预 测 出 在 这 个 “时 机 ”之 前 大 概 
能 回收 多 少 个 区 域 ， 并 以 此 作为 新 生 代 区 域 的 最 大 数目 。 当 预测 值 命 中 
时 ， 达 到 最 大 新 生 代 区 域 数 的 时 机 ， 刚 好 就 是 下 次 能 够 进行 GC 暂停 处 
理 的 时 机 ， 因 此 能 够 遵守 GC 单位 时 间 。 另 外 ， 因 为 最 大 新 生 代 区 域 数 
设置 的 是 最 小 值 ， 所 以 被 选 入 回收 集合 的 新 生 代 区 域 数 也 是 最 少 的 。 这 
样 一 来 ， 距 离 GC 暂停 时 间 上 限 很 可 能 还 有 一 段 时 间 ， 就 可 以 往 回 收集 
合 里 添加 一 些 老 年 代 区 域 。 部 分 新 生 代 GC 的 名 字 由 来 就 是 “ 尽 可 能 少 
地 转移 新 生 代 区 域 ”。 
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最 大 新 生 代 区 域 数 的 设置 发 生 在 并 发 标记 结束 之 后 。 


:二 GC 的 切换 


垃圾 回收 需 在 选择 GC 算法 时 ， 通 常会 选择 部 分 新 生 代 GC， 只 有 
在 使 用 完全 新 生 代 GC 效率 更 高 时 才 会 切换 为 完全 新 生 代 GC。 切换 的 
时 间 点 和 设置 最 大 新 生 代 区 域 数 时 一 样 ， 都 是 在 并 发 标记 结束 之 后 。 

首先 ， 参 考 并 发 标记 中 标记 出 的 死亡 对 象 个 数 ， 预 测 出 下 次 部 分 新 
生 代 GC 的 转移 效率 。 然 后 ， 根 据 过 去 的 完全 新 生 代 GC 的 转移 效率 ， 
预测 出 下 次 完全 新 生 代 GC 的 转移 效率 。 如 果 预 测 出 完全 新 生 代 GC 的 
转移 效率 更 高 ， 则 切换 为 完全 新 生 代 GC。 


二 GC 执行 的 时 机 


当 新 生 代 区 域 数 达 到 上 限时 ,会 触发 转移 的 执行 。 换 句 话说 ,通过 
调节 最 大 新 生 代 区 域 数 ， 可 以 控制 转移 执行 的 时 机 。 
当 转 移 完成 并 通过 以 下 4 项 检查 之 后 ， 会 开始 执行 并 发 标记 。 



























































中 不 在 并 发 标记 执行 过 程 中 

@) 并 发 标记 的 结果 已 被 上 次 转移 使 用 完 

已 经 使 用 了 一 定量 的 堆 内 存 ( 默认 是 全 部 堆 内 存 的 45% 以 上 ) 
人 相 比 上 次 转移 完成 之 后 ， 堆 内 存 的 使 用 量 有 所 增加 

















其 中 思 是 为 了 避免 重复 地 并 发 标记 。 如 果 有 并 发 标记 的 结果 尚未 在 
转移 过 程 中 被 使 用 ， 则 不 会 开始 并 发 标记 。 

需要 注意 的 是 ， 并 发 标记 过 程 中 的 所 有 和 暂停 处 理 都 需要 遵守 程序 对 
于 GC 暂停 处 理 的 调度 (4.4 节 )， 以 适当 的 时 间 间 隔 来 执行 。 


























本 章 将 总 结 一 下 前 面 介绍 的 GC 相关 处 理 之 间 的 关系 ， 然 后 介绍 一 











下 G1GC 的 优 缺 点 。 


GC 的 各 种 处 理 之 间 关 系 非常 复杂 ， 这 里 我 们 用 一 张 图 来 总 结 一 下 。 
图 6.1 展示 了 mutator 和 GC 的 执行 关系 示例 。 





Imutator —> 


标记 

















转移 专用 
维护 
6.1 mutator 和 GC 的 执行 关系 
图 中 并 列 的 箭头 表示 可 能 会 并 行 执行 的 处 理 。 


从 图 6.1 中 可 以 看 出 ， 转 移 专用 记忆 集合 维护 线程 和 mutator 在 大 

多 数 时 间 中 是 并 发 执行 的 ， 但 是 在 存活 对 象 计数 (2.7 节 ) 时 ， 转 移 专 
] 记 忆 集 合 维护 线程 也 是 暂停 的 。 

还 有 一 点 需要 注意 ， 那 就 是 转移 处 理 可 能 发 生 在 并 发 标记 中 暂停 处 
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理 以 外 的 所 有 时 刻 。 比 如 在 并 发 标记 阶段 或 者 存活 对 象 计数 的 过 程 中 ， 
都 可 能 执行 转移 。 


6.2 


首先 ，G1GC 具备 软 实 时 性 ， 这 是 一 个 很 大 的 优点 。 对 于 要 求 软 实 
时 性 的 应 用 程序 ， 可 以 由 用 户 控制 GC 暂停 时 间 。 

其 次 ， 它 能 够 充分 发 挥 高 配置 机 器 的 性 能 ， 大 幅 缩 减 GC 暂停 时 间 ， 
这 一 点 也 值得 表扬 。 虽 然 考 虑 到 算法 ， 总 有 一 些 必须 要 暂停 的 阶段 ,但 
这 些 阶段 也 可 以 通过 尽 可 能 地 并 行 执行 ， 来 进一步 缩短 暂停 时 间 。 

再 次 ， 它 通过 将 写 屏 障 的 处 理 粒度 由 对 象 粒度 改 为 更 粗 的 卡片 粒 
度 ， 降 低 了 写 屏 障 发 生 的 频率 。 这 也 是 缩短 暂停 时 间 的 一 个 手段 。 

另外 ， 因 为 有 转移 ， 所 以 区 域内 不 会 产生 内 存 碎片 。 由 此 可 以 提高 
引用 的 局 部 性 和 对 象 存储 空间 分 配 的 速度 。 

与 其 他 具备 软 实时 性 的 GC 相 比 ，G1GC 的 吞吐 量 保持 在 较 高 水 平 。 
近年 ， 很 多 具备 软 实时 性 的 GC 吧 ,名 会 通过 频繁 地 执行 “以 对 象 为 单位 
进行 复制 ”这 种 更 细 粒 度 的 暂停 处 理 来 缩短 GC 暂停 时 间 ， 从 而 达成 软 
实时 性 。 因 此 ， 无 论 如 何 它们 的 否 吐 量 都 是 下 降 的 。 男 外 ， 这 些 GC 中 
死亡 对 象 的 回收 处 理 可 能 存在 延迟 ， 因 此 内 存 的 使 用 效率 也 不 高 。 

而 G1GC 以 区 域 这 种 较 粗 的 粒度 来 频繁 地 执行 用 户 指定 时 间 内 的 暂 
停 处 理 ， 所 以 暂停 时 间 会 稍微 长 一 些 ， 它 的 吞吐 量 也 会 高 一 些 。 此 外 ， 
通过 在 转移 时 选择 合适 的 回收 集合 ， 还 能 够 更 高 效 地 回收 死亡 对 象 。 
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G1GC 的 适用 对 象 被 限定 为 “搭载 多 核 处 理 器 、 拥 有 大 容量 内 存 的 
机 器 "。 在 多 数 环境 下 ， 我 们 并 不 能 发 挥 出 它 的 性 能 。 适 用 环境 受 限 可 
以 说 是 它 的 一 个 缺点 。 

另外 在 转移 时 ， 尽 管区 域内 不 会 出 现 碎片 化 ， 但 是 会 出 现 以 区 域 
为 单位 〈 整 个 堆 ) 的 碎片 化 。 和 普通 的 GC 复制 算法 相 比 ， 这 一 点 算是 
缺点 。 
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在 前 言 中 ， 我 们 曾经 提 到 过 “预测 GC 暂停 时 间 ” 是 G1GC 中 一 个 很 
大 的 谜团 。 这 个 谜团 的 答案 比较 复杂 ， 本 书 花 费 了 数 十 页 篇 幅 去 讲解 。 

从 外 部 看 ，G1GC 好 像 只 是 能 够 指定 暂停 时 间 的 简单 GC。 但是， 
为 了 实现 指定 暂停 时 间 这 样 一 个 简单 的 需求 ，G1GC 的 内 部 逻辑 变 得 非 
常 复杂 。 看 似 简单 的 外 表 下 ， 隐 藏 着 无 比 复 森 的 细 季 ， 我 再 次 深 深 地 感 
受到 了 这 一 点 。 

G1GC 是 当前 最 强大 的 GC 算法 ， 而 且 OpenJDK 也 引入 了 它 ， 所 以 
未 来 它 一 定 会 成 为 广 为 使 用 的 GC 算法 。 读 到 这 里 ， 相 信 你 已 经 能 够 理 
解 GIGC 了 。 如 果 善 加 利用 ， 它 (也许 ) 会 成 为 你 的 一 大 武器 。 而 且 ， 
你 还 可 以 骄傲 地 跟 别 人 说 :“ 关 于 G1GC 的 内 容 尽 管 问 我 。 当然， 前 提 
是 你 身边 得 有 一 位 能 够 让 你 分 享 这 份 骄傲 的 GC 同好 。 


















































个 四 一 


流 误 GC 


对 象 的 担忧 








对 象 A ; “好像 出 现 了 一 种 新 的 GC 算法 。 

对 条 B 什么?” 

对 象 A :“ 他 们 都 叫 它 “ 流 误 GC: ， 据 说 连 存 活 对 象 都 会 被 它 鲁莽 地 
回收 掉 。” 
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对 象 B :“GC 好 可 怕 啊 。” 


G1GC 


Garbage First Garbage Collection 


实现 篇 


NA、 











实现 篇 里 ， 就 让 我 们 从 什么 是 HotSpotVM 开始 说 起 吧 。 


7 局 是 日 什么 是 HotSpotVM 


HotSpotVM 是 最 受 欢 迎 的 JavaVM， 由 甲骨 文公 司 主导 开发 。 

HotSpotVM 的 特点 在 于 “ 仅 将 程序 中 执行 频率 很 高 的 部 分 编译 为 机 
器 语言 ”。 这 样 做 是 为 了 优化 程序 中 耗 时 最 多 的 部 分 〈 执行 频率 很 高 的 部 
分 )， 缩 短程 序 的 整体 运行 时 间 。 此 外 ， 由 于 HotSpotVM 会 把 要 编译 为 
机 器 语言 的 代码 限制 在 某 个 范围 内 ， 所 以 还 可 以 缩短 编译 时 间 。 "执行 
频率 很 高 的 部 分 ” 称 为 HotSpot， 这 也 是 HotSpotVM 这 个 名 字 的 由 来 。 

HotSpotVM 的 另外 一 个 特点 是 实现 了 多 种 GC 算法 。GC 算法 的 调 
优 通常 会 分 为 是 以 响应 性 能 为 优先 的 ， 还 是 以 吞吐 性 能 为 优先 的 。 一 般 
来 说 ， 优 先 响 应 性 能 的 GC 算法 ， 其 吞吐 性 能 比较 差 ; 反之 ， 优 先知 吐 
性 能 的 GC 算法 ， 其 响应 性 能 比较 差 。 再 加 上 其 他 各 种 因素 的 影响 ， 现 
在 并 没有 完美 的 GC 算法 。 对 于 这 样 的 窘境 ，HotSpotVM 给 出 的 答案 是 
实现 多 种 GC 算法 。 这 样 一 来 ， 程 序 员 就 可 以 根据 应 用 程序 的 特性 来 选 
择 合适 的 GC 算法 。 也 就 是 说 ， 如 果 想 让 应 用 程序 具有 高 响应 性 ， 那 么 
程序 员 就 可 以 选择 最 合适 这 种 需求 的 GC 算法 。 这 种 让 程序 员 自 己 选择 
GC 算法 的 方法 可 以 说 非常 高 明 。 


PP 什么 是 OpenJDK 


Java SE Development Kit ( JDK ) 是 用 于 Java 开发 的 编程 工具 
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的 统称 。 
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在 JDK 中 ， 除 HotSpotVM 外 ， 还 有 将 Java 源码 编译 为 Java 字 节 三 
的 Java 编译 器 ， 以 及 根据 Java 源码 生成 文档 的 工具 等 。 

2006 年 11 月 , 当时 的 Sun? 公司 宣布 以 GPL v22 许可 免费 公开 JDK 
的 源码 。 这 个 开源 版 本 的 JDK 就 被 称 为 OpenJDK。 

本 书 编写 时 ，OpenJDK 的 最 新 版 称 为 OpenJDK 7， 而 甲骨 文公 司 官 
方 提供 的 JDK 最 新 版 则 称 为 DK 7。 尽 管 名 字 不 同 ， 但 它们 的 源码 几乎 
一 样 。 二 者 的 区 别 是 JDK 中 的 一 部 分 商业 代码 在 OpenJDK 中 被 开源 代 

















码 替 换 掉 了 。 








7 必 量 上 获取 源码 


OpenJDK 的 官方 网 站 如 图 7.1 所 示 。 


Ganeral FAOD 


Legal 
TYSVatorS 
Challonge 


ED 


Source code 


Compier 
Conformnce 

Core Wbraries 
Gowvernares Board 
Hot Spee 
InternatiornN ration 
JMX 

Networkang 
Netgen ns Proiects 
Perters 

Qality 

Soc arity 
Sorvicoability 
Sound 

Swing 


7 








Q@ Sun 公司 于 2009 和 





inarailing 

Contributing G 站 
Sonsornin3 

Developers Guide 

Pang lists 


What is this? The place to collaborate on an 
open-source implementation of the Java Platform, 
Standard Edition, and related projects. (Leam more.) 


Download and install the open-source JDK 6 for 
Ubuntu 8.04 (or later), Fedora 9 (or later), Red 
Hat Enterprise Linux 5, openSUSE 11.1, Debian 
GNU/Linux 5.0. or OpenSsolaris . If you came here 
looking for sun's JDK 6 product binaries for S$olanis, 
Linux, or Windows, which are based largely on the 
same code, you can download them from 
java.sun.com. 


OpenJDK 的 官方 网 站 


FE 被 甲骨 文公 司 收购 。 一 一 译 者 注 








@ GPL v2 ( GNU General Public License, version 2 ) : 自由 软件 许可 的 第 2 版 。 
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单 击 左 侧 列表 中 的 JDK 7， 跳 转 页 面 后 再 单 击 上 方 菜单 中 的 Milestones， 
就 能 查看 OpenJDK 7 的 开发 里 程 碑 。 

本 章 将 基于 本 书 编写 时 OpenJDK 7 的 最 新 版 本 jdk7-b147 进行 
讲解 。 

源码 可 以 从 以 下 网 址 下 载 。 





ituring.cn/book/1922 


如 果 想 要 获取 某 个 特定 开发 版 本 的 OpenJDK 7 的 源码 ， 也 可 以 使 用 
维护 在 GitHub 上 的 OpenJDK 的 代码 仓库 。GitHub 是 目前 最 流行 的 开源 
分 布 式 版 本 控制 系统 。 


7 尼 弛 代码 结构 
HotSpotVM 的 源码 位 于 src 文件 夹 内 ( 见 表 7.1 )。 
表 7.1 文件 夹 结 构 











文件 夹 说 明 
cpu 依赖 CPU 的 代码 
os 依赖 操作 系统 的 代码 

















os_cpu 依赖 操作 系统 和 CPU 的 代码 ( 如 在 Linux 上 且 是 x86 架构 的 CPU ) 
share 通用 代码 


在 表 7.1 最 后 的 share 文件 夹 内 有 一 个 vm 文 件 夹 ( 见 表 7.2 )， HotSpotVM 
的 大 部 分 源码 都 在 这 个 vm 文件 夹 内 。 


表 7.2 vm 内 的 文件 夹 结构 













































































文 件 夹 说 明 
cl C1 编译 器 
classfile Java 类 文件 的 定义 
gc_implementation GC 的 实现 部 分 
gc_interface GC 的 接口 部 分 
interpreter Java 解释 器 
oops 对 象 结构 的 定义 
runtime VM 运行 时 所 需 的 库 
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此 外 ,， 表 7.3 展示 了 src 文件 夹 内 的 代码 分 布 。 











表 7.3 代码 分 布 
C++ 420 791 93% 
Java 21:231 5% 
C 7432 2% 











HotSpotVM 内 约 有 45 万 行 代 码 ， 其 中 绝 大 部 分 是 C++ 代码 。 
yA 两 个 特殊 类 
HotSpotVM 内 的 大 部 分 代码 继承 自 以 下 两 个 类 中 的 一 个 。 


e@ CHeapobj 类 
e@ AllStatic 类 


由 于 这 两 个 类 在 代码 中 会 频繁 出 现 ， 所 以 我 们 先 来 看 看 它们 各 自 的 
昌 途 。 


-=n 





7.5.1 CHeapObj 类 


CHeapobj 类 是 一 个 由 C 的 堆 内 存 空间 来 管理 的 类 。cHeap0bj 类 的 
子 类 的 实例 都 会 被 分 配 在 C 的 堆 内 存 上 。 

CHeap0bj 类 的 一 个 特殊 之 处 在 于 它 重 写 了 new 和 delete 运算 符 ， 
在 常见 的 C++ 内 存 分 配 处 理 中 添加 了 调试 处 理 。 这 段 调试 处 理 只 会 在 开 
发 时 被 执行 。 

CHeap0bj 类 中 实现 了 多 段 调试 处 理 ， 不 过 这 里 我 们 只 来 看 看 其 中 
之 一 一 一 检测 内 存 是 否 被 破坏 的 调试 功能 。 

调试 过 程 中 ， 在 创建 CHeap0bj 类 (或 是 继承 自 CHeap0bj 的 类 ) 
的 实例 时 ， 调 试 功能 会 特意 分 配 一 些 多 余 的 内 存 空 间 。 图 7.2 是 分 配 后 
的 内 存 空间 示意 图 。 




















用 于 检测 内 存 是 否 被 破坏 












































0xRAB 
空间 
CHeapObj 实例 
ey 有 于 检测 内 存 是 否 被 破坏 
的 空间 
事先 向 用 于 检测 内 存 是 
否 被 破坏 的 空间 写 入 用 
于 检测 的 值 








7.2 调试 时 的 CHeapObj 实例 


如 图 7.2 所 示 ， 额 外 分 配 的 内 存 空间 被 用 作 “ 检 测 内 存 是 否 被 破坏 
的 空间 ”。 调 试 功能 会 事先 向 其 中 写 和 人 值 0xAB。CHeap0bj 类 的 实例 使 
用 的 是 图 7.2 正中 间 部 分 的 内 存 空 间 。 

然后 ， 当 cHeapobj 类 实例 的 delete 运算 符 被 调用 时 ， 调 试 功能 会 检 
测 空间 中 的 值 是 否 还 是 0xAB。 如 果 值 发 生 了 变化 ， 则 表示 在 超出 CHeapObj 
类 实例 范围 的 内 存 空间 里 发 生 了 写 值 操 作 。 这 就 是 内 存 被 破坏 的 证 据 ， 
因此 调试 功能 会 在 发 现 这 个 问题 后 输出 错误 信息 ， 然 后 终止 执行 。 











7.5.2 ”AllStatic 类 
AllStatic 类 是 一 个 “ 仅 带 有 静态 信息 ”的 特殊 类 。 
继承 自 A11Static 类 的 类 不 需要 创建 实例 。 因 此 ， 想 将 全 局 变量 
或 函数 集中 在 一 个 命名 空间 中 时 ， 可 以 使 用 继承 自 AllStatic 类 的 类 充当 
该 命名 空间 。 在 继承 类 中 内 会 定义 全 局 变量 和 它们 的 访问 方法 ， 以 及 前 


态 ( static ) 成 员 函 数 等 直接 通过 类 就 可 以 使 用 的 信息 。 
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YA 志明 适用 于 各 种 操作 系统 的 接口 


HotSpotVM 需要 运行 于 各 种 操作 系统 之 上 。 因 此 ， 开 发 者 为 
HotSpotVM 设计 了 一 种 巧妙 的 结构 ， 使 得 它 能 够 通过 统一 的 接口 来 处 理 
各 种 操作 系统 的 API。 





























share/vm/runtime/os.hpp 
Sl0rm ease oslo tet 


2235 SEaEnmcEcharnsessvegmemor (mes eho 0 


2 szent oliognmentahimnte = 0 
732%: }; 








由 于 os 类 继承 自 Allstatic 类 ， 所 以 不 创建 实例 就 可 以 使 用 。 
os 类 中 定义 的 成 员 函 数 在 HotSpotVM 中 都 有 对 应 各 种 操作 系统 的 








® os/posix/vm/os posix.cpp 
® os/linux/vm/os linux.cpp 
® os/windows/vm/os windows.cpp 


® os/solaris/vm/os solaris.cpp 


构建 OpenJDK 时 ，HotSpotVM 会 从 以 上 文件 中 ， 选 择 与 当前 操作 
系统 对 应 的 文件 进行 编译 和 链接 。 对 于 符合 POSIX API 标准 的 操作 系统 
(Linux 和 Solaris 都 属于 此 类 )，os /posix/vm/os_posix.cpp 会 被 链 
接 。 例 如 在 Linux 环境 下 ， 链接 的 就 是 os/posix/vm/os_posix.cpp 和 
os/linux/vm/os_linux.cppo 

因此 ， 如 果 上 面 那 个 share/vm/runtime/os.hpp 中 定义 的 
os::reserve memory() 被 调用 ， 那么 与 当前 操作 系统 相对 应 的 
os::reserve memory() 就 会 被 执行 。 

os : :xxx() 这 样 的 成 员 函 数 在 代码 中 会 经 常 出 现 ， 因 此 请 务必 掌握 
这 一 点 。 


对 象 管理 功能 











在 HotSpotVM 中 ， 我 们 可 以 自主 选择 使 用 哪 种 GC 算法 一 一 只 要 在 
Java 的 启动 选项 中 像 “-XX:+UseparalleGc” 这 样 指定 即 可 。 不 同 GC 
算法 所 管理 的 堆 的 布局 并 不 相同 。 当 然 ， 这 些 GC 算法 自身 也 不 同 。 本 
书 将 HotSpotVM 的 堆 和 GC 统称 为 对 象 管理 功能 。 本 章 我 们 将 从 整体 上 
来 看 一 看 对 象 管理 功能 。 


:入 放 对 象 管理 功能 的 接口 


图 8.1 展 


对 象 管理 























示 了 对 象 管理 功能 的 接口 示意 图 。 





对 象 管理 功能 





对 象 的 分 配 
请 求 显 式 地 执行 GC 
依赖 于 对 象 位 置 和 布局 的 处 理 





VM 
图 8.1 对 象 管理 功能 向 VM 公开 的 接口 的 示意 图 


功能 对 VM 主要 公开 了 以 下 3 种 接口 。 


GD 对 象 的 分 配 
@) 显 式 地 执行 GC 
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@) 依赖 于 对 象 位 置 和 布局 的 处 理 





接口 会 在 VM 指定 对 象 的 类 型 后 ， 将 VM 堆 内 部 分 配 的 对 象 实体 
返回 给 我 们 。 

接口 @ 会 在 我 们 请 求 执行 GC 时 ， 在 VM 堆 内 部 执行 GC。 

VM 并 不 知道 VM 堆 内 部 对 象 的 位 置 和 布局 ， 因 此 @) 是 必需 的 。 具 
体 来 说 ，@ 中 定义 了 一 系列 接口 ， 如 对 VM 堆 内 部 所 有 对 象 都 执行 指定 
函数 的 接口 、 对 某 个 对 象 内 部 所 有 的 字段 都 执行 指定 函数 的 接口 ， 以 及 
检查 指定 的 内 存 地 址 是 否 被 分 配 了 对 象 的 接口 等 。 

只 要 遵守 以 上 接口 ， 我 们 就 可 以 根据 自己 的 需要 改变 对 象 管理 功能 
的 内 部 实现 。 也 就 是 说 ， 只 要 接口 相同 ， 那 么 实现 不 同 的 GC 算法 也 
可 能 的 。 

VM 端 通常 会 使 用 上 述 接口 来 实现 GC 算法 ， 不 会 关注 接口 背后 的 
对 象 管理 功能 的 内 部 实现 。 但 也 有 例外 情况 ， 届 时 需要 根据 GC 算法 的 
种 类 进行 不 同 的 处 理 。 


5 光 于 对 象 管理 功能 的 全 貌 


图 8.2 展示 了 对 象 管理 功能 的 全 貌 。 





[ou 
































对 象 管理 功能 
在 需要 时 | CollectedHeap 类 yh 
执行 GC | 决定 策略 
VM 堆 
| = lectorpolicy 
类 


分 配对 象 请 求 


图 8.2 对象 管理 功能 的 全 和 貌 


CollectedHeap 类 是 接口 。CollectedHeap 类 根据 CollectorPolicy 类 
内 的 设 定 值 来 决定 GC 策略。 而 CollectedHeap 类 对 各 个 GC 类 发 送 请 
求 ， 要 求 它们 对 堆 内 部 执行 GC。 
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首先 ， 我 们 来 看 一 看 这 张 全 貌 图 中 的 出 场 角色 。collectedHeap 类 
负责 管理 用 来 分 配对 象 的 VM 堆 。 另 外 ， 它 还 具有 对 象 管理 功能 接口 的 
作用 ， 会 根据 collectorPolicy 类 中 的 数据 进行 合适 的 处 理 。 

CollectorPolicy 类 是 用 来 定义 对 象 管理 功能 整体 策略 ( policy ) 
的 类 。 该 类 中 保存 了 与 对 象 管理 功能 相关 的 设置 。 例 如 ， 程 序 员 在 执行 
Java 命令 时 指定 的 选项 ( GC 算法 等 ) 就 由 这 个 类 负责 管理 。 

各 个 GC 类 的 职责 是 释放 VM 堆 内 部 的 垃圾 对 象 ， 它 们 主要 被 
CollectedHeap 类 调用 。 由 于 算法 不 同 ，GC 类 也 大 不 相同 ， 所 以 这 里 
才 将 它们 统称 为 “各 个 GC 类 ”。 

如 图 8.2 所 示 ， 对 象 管理 功能 在 处 理 来 自 VM 的 分 配对 象 请 求 时 ， 
CollectedHeap 类 会 接收 请 求 ， 并 根据 CollectorPolicy 类 定义 的 策 
略 ， 在 内 部 内 存 空间 上 分 配对 象 。 如 果 没 有 足够 的 可 用 内 存 空 间 ， 它 就 
会 调用 合适 的 GC 类 来 执行 GC。 


:天 是 CollectedHeap 类 
下 面 我 们 详细 地 看 一 看 表示 VM 堆 的 CollectedqHeap 类 (图 8.3 )。 


CollectedHeap 


















































































































SharedHeap ||ParallelScavengeHeap 
人 


GenCollectedHeap GlCollectedHeap 


8.3 ”CollectedHeap 类 的 继承 关系 








如 图 8.3 所 示 ，VM 堆 是 由 collectedHeap 这 个 抽象 类 统一 进行 处 
理 的 。collectedHeap 类 会 根据 VM 堆 的 布局 派生 出 子 类 。 这 个 子 类 
就 是 VM 堆 的 实体 。 
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8.3.1 ”OpenJDK 7 的 启动 选项 和 VM 扒 类 


表 8.1 列举 了 在 OpenJDK 7 中 可 以 指定 的 GC 启动 选项 和 GC 所 对 
应 的 VM 堆 类 。 


表 8.1 启动 选项 和 使 用 的 VM 堆 类 
































-XX:UseSerialGC 串 行 GC GenCollectedHeap 
-XX:UseParallelGC 并 行 GC ParallelScavengeHeap 
-Xincgc 增 量 GC GenCollectedHeap 
-XX:UseConcMarkSweepGC 发 GC GenCollectedHeap 
-XX:UseG1GC G1GC GlCollectedHeap 














看 完 表 8.1 你 就 会 发 现 ，GC 算法 与 VM 堆 类 之 间 并 没有 明确 的 对 应 
关系 。GenCollectedHeap 会 被 多 种 GC 算法 使 用 , 但 GlcollectedHeap 
只 会 被 G1GC 使 用 。 

此 处 希望 大 家 注意 ， 不 要 仪 根据 GenCcollectedHeap 类 的 名 字 ， 就 
推测 所 有 分 代 GC 算法 都 会 使 用 这 个 堆 。HotSpotVM 的 并 行 GC 和 
G1GC 并 没有 使 用 GencollectedHeap， 但 它们 都 属于 分 代 GC 算法 。 


:电量 CollectorPolicy 类 


接 下 来 ， 我们 看 一 看 定义 对 象 管理 功能 策略 的 CollectorPolicy 
类 (图 8.4)。 




















CollectorPolicy 








GenCollectorPolicy 
人 
TwoGenerationCollectorPolicy 


GlCollectorPolicy 
人 
GlCollectorPolicy BestRegionsFirst 








GlYoungGenSizer 





ConcurrentMarkSweepPolicy 






AsConcurrentMarkSweepPolicy 





8.4 ”CollectorPolicy 类 的 继承 关系 
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如 图 8.4 所 示 ， 对 象 管理 功能 的 策略 是 由 CollectorPolicy 抽象 类 
统一 管理 的 。CollectorPolicy 类 会 根据 对 象 管理 功能 的 策略 派生 出 相 
应 的 子 类 。 


8.4.1 ”启动 选项 和 CollectorPolicy 类 


OpenJDK 7 中 可 以 指定 的 GC 启动 选项 ， 和 所 使 用 的 CollectorPolicy 
子 类 之 间 的 对 应 关系 如 表 8.2 所 示 。 


表 8.2 ”启动 选项 和 使 用 的 策略 


启动 选项 策 上 略 


























-XX:UseSerialGC MarkSweepPolicy 

-XX:UsePararllelGC GenerationSizer 

-Xincgc ConcurrentMarkSweePolicy 
(CMSIncrementalMode=true ) 

-XX:UseConcMarkSweepGC ConcurrentMarkSweePolicy 

-XX:UseG1GC GlCollectorPpolicy BestRegionsFirst 





CollectorPolicy 中 以 某 种 形式 保存 着 在 Java 的 启动 选项 中 指定 
的 GC 相关 信息 。 除 了 以 上 可 以 指定 GC 算法 的 启动 选项 外 ， 常 用 的 还 
有 通过 -xms 指定 的 初始 堆 大 小 的 选项 ， 以 及 通过 -xmx 指定 的 最 大 堆 大 
小 的 选项 等 。 此 外 ， 与 所 指定 的 GC 算法 相关 的 具体 设 定 值 ， 比 如 
G1GC 的 MaxGcPauseMillis( 最 大 暂停 时 间 ) 等 信息 也 保存 在 
CollectorPolicy 中 。 

CollectedHeap 会 参考 保存 在 CollectorPolicy 中 的 信息 ， 自 行 
决定 GC 的 执行 策略 并 执行 合适 的 GC 处理。 


CollectedHeap 使 用 各 个 GC 类 进行 VM 堆 内 部 的 垃圾 回收 。 各 个 
GC 类 并 没有 共同 的 接口 ， 它 们 的 定义 比较 随意 。 根 据 GC 算法 的 不 同 ， 
它们 的 实现 也 各 不 相同 ， 只 是 拥有 一 个 共同 的 目的 ， 那 就 是 VM 堆 上 的 
垃圾 回收 。 不过， 尽管 这 些 类 的 定义 比较 随意 , 但 collectedHeap 类 
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吸收 了 它们 之 间 的 区 别 ， 因 此 对 VM 端 几乎 没有 什么 影响 。 

我 推测 ， 这 样 做 是 在 提高 GC 类 的 自由 度 ， 以 便 将 来 能 够 把 任意 
GC 算法 都 灵活 地 添加 到 VM 中 。 实 际 上 ，G1GC 这 种 相当 特殊 的 算 
法 就 是 作为 GC 类 被 开发 ， 在 不 破坏 整体 设计 的 情况 下 被 引入 到 VM 
中 的 。 

本 书 只 对 在 G1GC 中 用 到 的 那些 GC 类 进行 讲解 。 如 果 大 家 对 其 他 
GC 类 感 兴趣 ， 可 以 以 表 8.1 和 表 8.2 中 对 应 的 CollectedHeap 和 
CollectorPolicy 为 线索 ， 去 研究 OpenJDK 的 源码 。 












































本 章 讲解 G1GC 的 VM 堆 结构 。 


5 CT 


如 图 9 





.1 所 示 ，HotSpotVM 的 VM 堆 大 体 上 分 为 以 下 两 个 部 分 。 








Q 程序 员 选 择 的 GC 算法 所 使 用 的 内 存 空间 
@) 常 驻 (permanent ) 内 存 空间 





VM 堆 














程序 员 选 择 的 GC 算法 所 使 用 的 











内 存 空间 








图 9.1 VM 堆 的 全 貌 





当 程 序 员 选 择 了 GC 算法 后 ，HotSpotVM 会 创建 一 个 结构 上 适合 该 
算法 的 内 存 空间 。 这 个 内 存 空间 就 是 上 面 的 DD。 该 GC 算法 管理 的 对 象 
会 被 分 配 在 这 块 内 存 空间 中 。 








@) 常 对 





顾名思义 ， 











内 存 空 间 中 “ 常 驻 ”的 英文 permanent 是 “永久 ”的 意思 。 
常 驻 内 存 空间 中 分 配 的 是 类 型 信息 或 方法 信息 等 永久 存在 的 

















对 象 。 该 空间 的 结构 几乎 不 会 随 着 GC 算法 的 变化 而 变化 。 


9.1;1 


VM 准 类 的 初始 化 





所 有 的 VM 堆 类 都 继承 自 collectedHeap 类 。 
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share/vm/gc interface/collectedHeap.hpp 


53: class CollectedHeap : public CHeapobj { 


286: veeualboonpermanene (conste oleonse 0 
3 inline static oop obj allocate (KlassHandle klass, int size, TRAPS); 
497: virtual void collect (GCCause: :Cause cause) = 0; 





如 上 所 示 ，CollectedHeap 类 具有 各 种 各 样 的 接口 。 
Universe: :initialize heap() 会 选择 合适 的 VM 堆 类 。 
share/vm/memory/universe.cpp 
882: jint Universe::initialize heap() { 
B33 
884: if (UseParallelGC) { 


886: Universe:: collectedHeap = new ParallelScavengeHeap () ; 


891:  } else if (UseGlGc) { 


8935: GlCollectorPolicy* glp = new GlCollectorPolicy BestRegionsFirst (); 
894: GlCollectedHeap* glh = new GlCollectedHeap (gl1p); 
8955 Wenss .Meollec eee ol 


900:  } else { 
GONE emweole<Eoeeclac em 


/* 省 略 : 选择 合适 的 CollectorPolicy */ 


SO Universe:: "CollectedHeap = new GenCollectedHeap (ge policy),; 
9208 } 

Bate 

C228 meeSbaeuse Un er er na na 





关于 GC 算法 与 VM 堆 类 的 对 应 关系 ，8.4 节 中 已 经 讲解 过 了 。 这 





里 请 注意 ,合适 的 VM 堆 类 的 实例 被 创建 并 存储 在 Universe::_ 








collectedHeap 中 后 ,该 VM 堆 类 的 initialize() 方法 就 会 被 调 





j。 








Universe 类 如 下 所 示 ， 它 继承 自 Allstatic 类 。 


share/vm/memory/universe.hpp 


class Universe: AllStatic { 


113': 
Os: statle eolleetedleap eolneetediean, 
346: static CollectedHeap* heap() { return collectedHeap; } 


通过 调用 Universe: :heap() 方法 ， 可 以 获取 选 自 Universe:: 
initialize_heap() 方法 的 合适 的 VM 堆 类 实例 。 


P29G1GC 堆 
P 所 说 ，G1GC 的 堆 被 分 为 了 一 定 大 小 的 若干 


正如 算法 篇 的 1.2 节 吕 
区 域 。 这 里 我 们 看 一 看 G1GC 是 如 何 维护 各 个 区 域 的 。 








9.2.1 G1CollectedHeap 类 
GlCollectedHeap 类 承担 了 非常 多 的 职责 ， 一 次 性 讲解 这 些 职责 


只 会 让 大 家 感到 混乱 ， 因 此 这 里 主要 介绍 GlcollectedHeap 类 的 3 个 
量 (图 9.2)。 


ho 





e@ _hrs: 通过 数组 维护 所 有 HeapRegion 
e young 1list: 新 生 代 HeapRegion 的 链表 
e@ free region 1ist: 空间 HeapRegion 的 链表 























HeapRegionSed 
_regions 
glcollectedHeap 
HeapRegionSeq* hrs 
| wlHeapRegion |-slHeapRegion | |HeapRegion NO 




















YoungList* _young list 
HeapRegion* 2 


9.2 G1GC 堆 的 结构 
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管理 各 个 区 域 的 是 HeapRegion 类 。G1CollectedHeap 类 中 有 名 为 
_hrs 的 成 员 变 量 ,保存 着 指向 HeapRegionSseq 实 例 的 指针 。 在 
HeapRegionSeq 的 成 员 变 量 regions 中 ， 以 数组 的 形式 保存 着 与 
G1GC 堆 内 部 所 有 区 域 相对 应 的 HeapRegion 地 址 。 

各 个 HeapRegion 通过 G1lCollectedHeap 类 中 的 _young 1ist 和 
_free region list, 以 单 向 链表 的 方式 连接 在 一 起 。 

新 生 代 的 HeapRegion 与 young_1list 相连 ， 对 应 空闲 区 域 的 
HeapRegion 与 空 区 域 链 表 (_free _region_ list ) 相连 ， 而 老年 代 的 
HeapRegion 则 没有 与 任何 东西 连接 在 一 起 。 


























9.2.2 “HeapRegion 类 


HeapRegion 类 中 的 两 个 成 员 变 量 _bottom 和 _end 分 别 保存 着 区 
域 的 头 地 址 和 尾 地 址 (图 9.3 )。 


HeapRegion HeapRegion 





_bottom end _bottom end 


G1GC 堆 





9.3 HeapRegion 





HeapRegion 类 的 继承 关系 如 图 9.4 所 示 。 









人 
八 


人 


GlOffsetTableContigSpace 


人 
图 9.4 HeapRegion 的 继承 关系 






74 | 第 9 章 堆 结构 


尽管 HeapRegion 类 的 继承 层次 很 深 ， 但 我 们 并 没有 必要 完全 掌握 
它们 。 只 要 知道 HeapRegion 类 从 各 种 类 中 继承 了 许多 功能 就 可 以 了 。 

除了 上 面 提 到 的 _bottom 和 end 外 ，HeapRegion 类 还 拥有 成 员 
变量 top。 该 变量 中 保存 着 区 域内 的 空闲 内 存 空间 的 头 地 址 。_pbottom、 
_end 和 top 都 是 定义 在 Space 类 中 的 成 员 变量 。 

HeapRegion 类 中 定义 有 以 下 两 个 用 于 单 向 链表 的 成 员 变 量 。 









































() next young region 


@ next in special set 





顾名思义 ，QD 指 的 是 下 一 个 新 生 代 区 域 。 

(的 _next_ in special_set 成 员 变量 会 根据 区 域 所 属 集合 的 不 同 
而 指向 不 同意 义 的 区 域 。 具 体 而 言 ， 当 区 域 属于 空闲 区 域 链表 时 ， 它 与 
下 一 个 空闲 区 域 相 连 ; 当 区 域 属于 回收 集合 链表 时 ， 它 与 当前 正在 被 使 
用 且 是 下 一 个 回收 对 象 的 区 域 相 连接 。 

此 外 , 将 _next in special set 成 员 变 量 与 区 域 相连 接 时 ， 为 了 
记 住 _next_in_special_set 成 员 变 量 的 用 途 ，HeapRegion 类 会 设置 
一 个 标志 位 来 表示 “这 块 区 域 属于 哪个 集合 ”。 

用 作 标 志 位 的 主要 成 员 变 量 如 下 所 示 。 它 们 都 是 bool 类 型 的 。 












































a 





























e _in collection set: 回收 集合 内 的 区 域 
e@ _is gc alloc region: 在 上 次 转移 后 被 分 配 了 对 象 的 区 域 


9.2.3 ”HeapRegionSeq 类 





HotSpotVM 自身 实现 了 一 个 用 来 表现 数组 的 类 GrowableArray， 
而 HeapRegionSeq 类 则 是 该 类 的 包装 类 。 








share/vm/gc _ implementation/g1/heapRegionSeq.hpPp 


34: class HeapRegionSed: public CHeapobj { 
到 3 


3 GrowableArray<HeapRegion*> regions; 
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56: pul 

63 : void insert (HeapRegion* hr); 

oF HeapRegion* at(size t i) { return regions.at((int)i); } 
Ti 





第 38 行 的 _regions 成 员 变 量 是 个 数组 (GrowableArray 类 的 实 
例 )， 里 面 保存 着 与 区 域 相对 应 的 HeapRegion 类 的 实例 。 

GrowableArray 类 与 普通 的 数组 不 同 ， 当 我 们 向 其 中 添加 元 素 时 ， 
它 的 容量 会 自动 扩大 。 从 名 字 中 也 可 以 看 出 ， 它 是 一 种 容量 可 以 增 大 
(growable ) 的 数组 。 

_regions 中 保存 的 区 域 ( HeapRegion 类 实例 ) 按照 各 区 域 头 地 址 
的 升序 排列 。 第 63 行 中 insert () 成 员 函 数 的 作用 是 向 _regions 中 添 
加 一 个 新 的 区 域 地 址 。 这 个 insert () 方法 会 进行 排序 处 理 。 

第 70 行 中 at() 成 员 函 数 的 作用 是 返回 指定 索引 上 的 区 域 。 


管理 G1GC 常 驻 空间 的 是 CompactingPermGenGen 类 。 

glcollectedHeap 类 的 _perm_gen 成员 变 量 中 保存 着 指向 
CompactingPermGenGen 实例 的 指针 。 

常 驻 空间 并 不 是 G1GC 的 回收 对 象 ， 而 是 标记 一 压缩 GC ( mark- 
compact GC ) 的 回收 对 象 ， 因 此 本 章 不 对 其 进行 详细 讲解 。 












































本 章 将 讲解 HotSpotVM 中 的 内 存 分 配 右 。 





中 有 包间 内 存 分 配 的 流程 


让 我 们 从 VM 堆 的 初始 化 开始 ， 看 一 看 G1GC 中 对 象 内 存 分 配 的 





流程 。 

内 存 分 配 流程 的 第 一 步 是 按照 G1GC 最 大 VM 堆 ( G1GC 堆 与 常 驻 
存 空间 ) 的 大 小 来 申请 内 存 空 间 (图 10.1 )。 程 序 员 可 以 指定 G1GC 
大 堆 空 间 和 最 大 常 驻 空间 的 大 小 。 如 果 没 有 指定 ， 那 么 G1GC 最 大 堆 
间 默 认为 64 MB， 最 大 常 驻 空间 也 默认 为 64 MB， 共计 128 MB ( 根 
使 用 的 操作 系统 不 同 ， 默 认 值 有 所 不 同 ),。 男 外 ，G1GC 的 VM 堆 是 
按照 区 域 大 小 对 齐 的 。 

















疆 尽 和 车 也 











G1GC 堆 常 驻 内 存 空间 























内 存 空间 的 申请 
图 10.1 GD VM 堆 的 申请 





请 注意 ， 在 目前 这 个 阶段 还 只 是 申请 内 存 空间 ， 并 没有 实际 地 分 配 
物理 内 存 。 

接 下 来 ,需要 为 之 前 申请 的 VM 堆 分 配 最 小 限度 的 内 存 空间 。 这 里 
会 实际 分 配 物理 内 存 。G1GC 堆 内 的 内 存 会 以 区 域 为 单位 分 配 (图 10.2 )。 
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GI1GC 堆 常 驻 内 存 空 间 
rr] 7 
内 存 空间 的 分 配 


图 10.2 Q@@ VM 堆 的 分 配 





这 里 ， 我 们 省 略 关于 常 驻 内 存 空 间 分 配 的 说 明 ， 只 讲解 G1GC 堆 内 
的 内 存 分 配 。 如 图 10.3 所 示 ， 分配 右 已 经 在 G1GC 堆 上 为 区 域 分 配 了 
空间 ， 对 象 则 会 被 分 配 到 相应 的 区 域内 。 


Gl1GC 堆 


NDE EZ 


对 象 的 分 配 





义 


10.3 @@) 对 象 的 分 配 


随 着 越 来 越 多 的 对 象 被 分 配 ， 可 使 用 的 区 域 会 逐渐 枯竭。 这 时 需要 
从 之 前 申请 的 内 存 空间 中 取出 内 存 并 分 配给 新 的 区 域 ， 让 G1GC 堆 得 到 
扩展 (图 10.4 )。 于 是 对 象 就 可 以 被 分 配 到 刚才 新 分 配 的 区 域 中 。 














G1GC 堆 


堆 区 域 的 分 配 
10.4 ”G1GC 堆 的 扩展 


IEVM 堆 请 | 


下 面 我 们 来 看 一 看 VM 堆 的 申请 是 如 何 实 现 的 。 

各 VM 堆 初 始 化 的 处 理 编写 在 继承 自 CollectedHeap 类 的 各 子 类 
的 initialize() 方法 中 。 对 G1GC 而 言 ， 就 是 在 GlCcollectedHeap 
的 initialize() 方法 中 。 如 果 仅 把 VM 堆 的 “申请 内 存 空间 ”处 理 部 
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分 的 源码 提取 出 来 ， 则 是 下 面 这 样 的 。 
share/vm/gc implementation/g1/glCollectedHeap.cpp 
1794: jint GlCollectedHeap::initialize() { 
eno Size t max byte size = collector policy() >max heap byte size(); 


1819': permanenteCeneratlonSpece gs = "coectorpolmey( 
->permanent generation (); 


lias ReservedSpace neapnrs namby te ne ra >maxas uzen 
T8826: HeapRegion: :GrainBytes， 
2 UseLargePages, addr); 





第 1810 行 的 collector policy() 成 员 函 数 ， 返 回 的 是 指向 
G1CollectorPolicy 实例 (其 中 定义 了 与 G1GC 相关 的 标志 位 和 设 定 
值 等 ) 的 指针 ,而 max_heap_byte_size() 成 员 函 数 则 正如 其 字面 意 
思 , 返回 的 是 G1GC 堆 的 最 大 大 小 。 因 此 ，max_byte_size 局 部 变量 
中 存放 的 就 是 G1GC 堆 的 最 大 大 小 。 

第 1819 行 的 pgs 中 存放 的 是 PermanentGenerationSpec， 它 定义 
了 与 常 驻 空 间 相关 的 设 定 值 等 。 

第 1825 行 代码 会 创建 Reservedspace 类 的 实例 。 这 时 会 实际 地 申 
请 VM 堆 。 在 创建 Reservedspace 类 的 实例 时 ， 需 要 传递 以 下 人 参数。 
第 1827 行 的 其 他 参数 ( UseLargePages、addr ) 不 会 被 用 到 ， 因 此 可 
以 忽略 它们 。 






































Q) G1GC 堆 的 最 大 大 小 + 最 大 常 驻 空间 的 大 小 
@) 区 域 大 小 (HeapRegion: :GrainBytes ) 











EN 





LE 


是 申请 的 内 存 空 间 的 大 小 。@ 被 用 于 对 齐 内 存 空 间 。 
核心 的 Reservedspace 类 的 定义 如 下 。 





share/vm/runtime/virtualspace.hpp 


32: class ReservedSpace VALUE OBJ CLASS SPEC { 
335 Erlend elass MStructe, 
BAe 
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SER Gna nas 
6 LSE EE Sige 
38: suze enelionmene, 











第 35 行 中 的 _base 成 员 变 量 中 存放 的 是 申请 到 的 内 存 空间 的 头 地 
址 。 size 中 存放 的 是 内 存 空间 的 大 小 ， _alignment 中 存放 的 则 是 内 
存 空间 对 齐 后 的 值 。 

这 里 没有 展示 详细 的 实现 。 在 目前 这 个 阶段 ， 大 家 只 要 知道 创建 
ReservedSpace 类 的 实例 就 相当 于 申请 了 内 存 空 间 就 可 以 了 。 














share/vm/gc implementation/g1/glCollectedHeap.cpp 


1794: jint GlCollectedHeap::initialize() { 





/* 省 略 :ReservedSpace 的 创建 */ 
1884: ReservedSpace gl1 rs = heap rs.first part (max byte size); 


8 ReservedSpace perm genrs = heaprs.last part (maxo byte Si2e), 


在 创建 完 Reservedspace 类 的 实例 后 ， 申 请 到 的 内 存 空 间 会 被 一 
分 为 二 ,一 份 用 作 G1GC 堆 ， 另 一 份 用 作 常 驻 空 间 。 这 两 部 分 分 别 保存 
在 对 应 的 局 部 变量 ( g1_ rs 和 perm gen rs ) 中 。 


10.3 


对 之 前 申请 到 的 VM 堆 内 存 进 行 实际 分 配 的 是 Virtualspace 类 。 


























share/vm/gc implementation/g1/glCollectedHeap.hpp 
143: class GlCollectedHeap : public SharedHeap { 


GE VuetualSpace qos eoradge, 


GlCollectedHeap 类 中 定义 了 一 个 存放 VirtualSpace 类 实例 的 成 


员 变 量 〈 请 注意 不 是 指针 )。 








share/vm/gc implementation/g1/glCollectedHeap.cpp 


1794: jint GlCollectedHeap::initialize() { 
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/* 省 略 : GlGc 扒 内 存 空 间 的 申请 */ 


lel: osioragennm loll so 


第 1891 行 代码 会 初始 化 _g1_storage 成 员 变 量 。 这 里 传递 的 第 1 
个 参数 是 之 前 创建 的 用 于 G1GC 堆 的 Reservedspace 的 指针 ， 第 2 个 参 
数 是 要 分 配 的 内 存 大 小 ， 此 处 为 0。 因此， 此 时 还 没有 进行 实际 的 内 存 
分 配 。 

接 下 来 看 一 看 实际 分 配 内 存 的 处 理 。 
































share/vm/gc implementation/g1/glCollectedHeap.cpp 
1794: jint GlCollectedHeap::initialize() { 


T1809e Silene mnby Een oetornoley UN 
->initial heap byte size(); 

















/* 省 略 : G1GC 堆 内 存 空 间 的 申请 */ 





1937: if (!expand(init byte size)) { 





首先 ，initialize() 成 员 函 数 的 第 1809 行 代码 将 启动 时 要 分 配 的 
内 存 空 间 的 大 小 保存 在 init_byte_ size 中 。 然 后 ，expand() 成 员 函 
数 内 会 进行 实际 的 内 存 分 配 处 理 。 











10.3.1 区 域 的 分 配 加 


expand () 是 根据 指定 的 内 存 空 s 间 大 小 分 配 区 域 的 方法 。 如 果 在 初 
始 化 VM 堆 时 空 闪 区 域 村 竭 了 ， 那 么 该 方法 就 会 被 调用 。 




















share/vm/gc implementation/g1/glCollectedHeap.cpp 
1599: bool GlCollectedHeap::expand (size t expand bytes) { 


/* 省 略 : 

* 将 expand_bytes 以 区 域 大 小 为 边界 向 上 对 齐 
* 将 结果 赋值 给 aligned expand bytes 

#7 








TO Heapwords molend (leanora donegone, 
re: bool successful = gl storage.expand by(laligned expand bytes); 
len ueeessE nl 
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(Sule HeapWord* new end = (HeapWord*) gl storage.high(); 
1624: expand bytes = aligned expand bytes; 

2D HeapWord* base = 0ld end; 

2a 

1627: // 在 old_end 和 new_end 之 间 创 建 堆 区 域 

1628: while (expand bytes > 0) { 

S20 HeapWord* high = base + HeapRegion::GrainWords; 
L630 

1631: // 创建 区 域 

L632 MemRegion mr (base, high); 

1634: HeapRegion* hr = new HeapRegion( bot shared, mr, is zeroed); 
L635% 

1636: // 添加 到 HeapRegionSed 中 

BE oe Sa (ly 

T6385 EreenLise addlasea (lhe); 

1643: expand bytes -= HeapRegion::GrainBytes; 

1644: base += HeapRegion::GrainWords; 

1645: } 

1667: return successful; 

1668: } 


代码 的 前 半 部 分 用 来 将 接收 到 的 参数 expand_bytes 以 区 域 大 小 为 
边界 向 上 对 齐 ， 然 后 将 结果 赋值 给 aligned_expand bytes。 

第 1610 行 代码 用 来 接收 正在 分 配 的 内 存 空间 的 边界 。 由 于 在 初始 
化 VM 堆 时 还 没有 分 配 内 存 空 间 ， 所 以 这 里 返回 的 是 申请 到 的 用 于 VM 
堆 内 存 空 间 的 头 地 址 。 这 行 代码 中 的 HeapWord* 是 指向 VM 堆 内 地 址 
时 使 用 的 。 

实际 的 内 存 分 配 发 生 在 第 1611 行 VirtualSpace 的 expand by () 
中 。expand_by () 的 参数 是 要 分 配 的 内 存 大 小 。 这 里 向 参数 传递 的 是 
aligned expand bytes， 即 要 分 配 的 区 域 大 小 的 字 节 数 。 

如 果 内 存 分 配 成 功 了 ， 后 续 代 码 就 会 创建 出 负责 管理 区 域 的 
HeapRegion。 

第 1629 行 代码 将 距离 pase 一 个 区 域 大 小 的 地 址 赋值 到 high 中 。 
第 1632 行 的 MemRegion 类 是 管理 地 址 范围 的 类 。 它 的 构造 函数 会 接收 
要 管理 的 地 址 范围 的 头 地 址 和 尾 地 址 作为 参数 。 接 着 ,第 1634 行 代码 
会 创建 HeapRegion 类 的 实例 。 第 1 个 参数 _bot_shared 和 第 3 个 参数 
is_zeroed 与 区 域 分 配 并 没有 什么 关系 ， 这 里 我 们 先 不 管 它们 。 






























































82 | 第 10 章 分 配器 


第 1637 行 


代码 将 指向 刚 创 建 的 HeapRegion 实例 的 指针 添加 到 


HeapRegionSeq 中 ,第 1638 行 代码 将 这 个 指针 添加 到 _free_region_ 
1ist 末尾 。 至 此 ,一 个 区 域 的 内 存 分 配 处 理 就 结束 了 。 接 下 来 要 做 的 就 


是 反复 执行 这 段 处 理 ， 








直到 将 由 第 1611 行 分 配 的 内 存 空 


expand_bytes ) 全 部 实际 分 配 完毕 。 


10.3.2 _ Windows 上 内 存 空 间 的 申请 和 分 配 


间 的 申请 和 分 配 实际 上 是 怎样 实现 的 呢 ? 其 实 ， 实现 方法 
会 根据 操作 系统 的 不 同 而 不 同 。 这 里 我 们 先 来 看 一 看 Windows 上 的 实现 





内 存 空 


方法 。 


Windows 上 有 一 个 叫 作 VirtualAlloc () 
使 用 这 个 API 实现 内 存 申 请 和 分 配 的 。 
是 底层 API， 





VirtualAlloc() 


间 (aligned_ 




















页 空间 。 它 接收 以 下 参数 。 


中 要 


那么 将 由 系统 决定 要 申请 或 分 配 的 内 存 空 





申请 或 分 配 的 内 存 空 





@ 大 小 
(3) 分 配 类 型 
访问 保护 的 类 型 





下 面 我 们 来 看 一 看 实际 
































的 API。HotSpotVM 就 是 


j 于 申请 和 分 配 虚拟 内 存 空间 内 的 


3 间 的 起 始 地 址 。 如 果 这 个 参数 为 NULL， 














3 间 的 起 始 地 址 


1 请 内 存 空间 的 os : :reserve _memory() 成 





员 函 数 。 代 码 中 省 略 了 不 需要 的 部 分 。 


os/windows/vm/os windows.cpp 


hao eer enamemor lt eehar dd 
size t alignment hint) { 
char* res = (char*)VirtualAlloc (addr, bytes, MEM RESERVE, 
PAGE READWRITE); 


ls 


2724: 
aase 


全 
溪 
yu 


Telurm Les 


A 行 第 3 








参数 的 MEM_RESERVE 就 是 





申请 内 存 时 的 标 








10.3 ”VM 扒 的 分 配 | 83 


志 位 。 向 VirtualAlloc () 方法 传递 了 MEM RESERVE 后 ,VirtualAlloc() 
只 会 申请 指定 大 小 的 内 存 空 间 ， 而 不 会 进行 实际 的 物理 内 存 分 配 。 

接 下 来 看 一 看 用 来 分 配 内 存 的 os: :commit_memory() 成 员 函 数 。 
代码 中 省 略 了 不 需要 的 部 分 。 

















os/windows/vm/os windows.cpp 
2 Doo eommememory (cna et ve oeee) { 


2866: bool result = VirtualAlloc (addr, bytes, MEM COMMIT， 
PAGE READWRITE) = 07 


2 return result; 
2874: } 
传递 给 第 2866 行 第 3 个 参数 的 MEM_coMMIT 就 是 分 配 内 存 空间 时 的 
标志 位 。 向 VirtualAlloc() 方法 传递 了 MEM COMMIT 后 ，VirtualRAlloc () 
就 会 按照 指定 的 大 小 实际 分 配 物 理 内 存 。 








10.3.3 ”Linux 上 内 存 空间 的 申请 和 分 配 

在 Linux 上 ， 用 来 实现 内 存 空间 申请 和 分 配 的 是 mmap () 。 

Linux 中 没有 申请 内 存 空间 的 概念 ， 调 用 mmap ( ) 后 就 会 分 配 内 存 
空间 。 不 过 ， 分 配 内 存 空间 后 并 非 立即 就 会 分 配 物 理 内 存 。 只 有 在 分 配 
到 的 内 存 空间 被 访问 时 才 会 实际 地 发 生物 理 内 存 分 配 。 

下 面 ， 我 们 来 看 一 看 用 于 申请 内 存 空间 的 成 员 函 数 o8: :resetrve_ 
memory () 在 Linux 中 是 什么 样 的 吧 。 






































os/linux/vm/os_linux.cpp 


Zoya oe Venmmom lu by ts ena coastedad 
2 size t alignment hint) { 

27895 return anon mmap (requested addr, bytes, (requested addr != NULL)); 
29l0F 


2 al ena anonimmapl(lenam enue ed en tes 
bool fixed) { 

27152% had 

/BA ES 
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2754: 
2755. 
27506: 
SS 
2759: 


A763. 


2764: 


D7 76s 
2 


2 
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flags = MAP PRIVATE | MAP NORESERVE | MAP ANONYMOUS; 
if (fixed) { 
flags |= MAP FIXED; 
} 
addqr = (char*).: :mmap (requested addr, bytes, 
PROT READ|PROT WRITE, 
elagspe on 


return addr == MAP FAILED ? NULL : addr; 














:reserve memory() 只 在 内 部 调用 os::anon mmap ()。 





os::anon mmap () 会 使 用 MAP_ANONYMOUS 来 分 配 内 存 空间 。 请 注意 在 
Linux 版 中 ， 它 不 是 申请 内 存 ， 而 是 实际 地 分 配 内 存 。 

在 第 2751 行 代码 中 ， 传 递 给 mmap () 的 f1ag 局 部 变量 中 设置 的 是 
MAP_NORESERVE， 表 示 “ 不 申请 交换 空间 ”( swap space )。 在 调用 


mmap ( 














分 配 了 内 存 地 址 后 ， 为 了 保证 一 定 能 够 分 配 到 这 些 内 存 空 间 ， 


有 些 操作 系统 还 会 接着 申请 对 应 大 小 的 交换 空间 。 而 MAP_NORESERVE 
标志 位 的 作用 就 是 防止 系统 这 么 做 。 由 于 os : :reserve_memory() 这 个 
阶段 只 是 申请 用 于 VM 堆 的 内 存 空间 ， 而 不 会 进行 对 象 分 配 等 实际 访问 
内 存 的 操作 ， 所 以 此 时 申请 交换 空间 其 实 是 一 种 浪费 。 对 于 HP-UX” 那 















































种 会 申请 交换 空间 的 操作 系统 来 说 ， 这 种 处 理 方式 非常 有 效 。 








与 内 存 空间 分 配 相对 应 的 部 分 一 一 成 员 函 数 os : :commit_memory () 








的 处 理 则 相反 ， 它 会 在 调用 mmap ( ) 时 指定 要 分 配 的 内 存 空间 大 小 ,但 
不 指定 MAP NORESERVE 标志 位 。 它 与 os: :reserve_memory () 的 处 理 
相似 ， 这 里 就 省 略 了 其 代码 。 

在 Linux 上 实际 分 配 物 理 内 存 的 时 机 和 在 Windows 上 的 不 同 。 只 有 
在 分 配 好 的 内 存 空间 上 分 配 了 对 象 ，Linux 才 会 在 HotSpotVM 实际 访问 


那 块 内 存 空 











3 间 时 分 配 物 理 内 存 。 








QD HP-UX 是 惠普 公司 设计 的 UNIX 操作 系统 。 
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10.3.4 ”VM 堆 中 实现 对 齐 的 方法 
VM 堆 是 以 区 域 大 小 对 齐 的 。 也 就 是 说 ，VM 堆 的 头 地 址 是 区 域 大 
小 的 整数 倍 。 那 么 ,在 HotSpotVM 中 是 如 何 实 现 对 齐 的 呢 ? 
其 实 ， 实 现 方法 非常 简单 。 为 了 便于 说 明 ， 我 们 假设 对 齐 大 小 (区 
域 大 小 ) 为 1 KB,，VM 堆 的 大 小 大 于 1 KB。 具 体 的 对 齐 步骤 如 下 所 示 
(图 10.5 )。 











QD 申请 VM 堆 大 小 的 内 存 空间 

@ 记录 在 中 的 内 存 范围 内 且 地 址 是 1 KB 的 倍数 的 地 址 

@) 释放 之 前 申请 的 内 存 空间 

(4 指定 通过 CO) 记 录 的 地 址 ， 再 次 申请 VM 堆 大 小 的 内 存 空 间 
@) 如 果 人 由 失败 了 ， 则 返回 到 重新 开始 























中 VM 堆 大 小 
(1KB 以 上 ) 






































1 请 
应 该 在 某 个 地 方 
1 KB 的 倍数 的 地 址 








1 KB 的 倍数 的 地 址 
® VM 堆 大 小 
(1KB 以 上 ) 


申请 





1KB 的 倍数 的 地 址 
10.5 ”申请 内 存 对 齐 的 VM 堆 
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首先 ， 在 中 中 申请 VM 堆 大 小 的 内 存 空间 。 申 请 内 存 空间 时 使 用 
oS::reserve memory () 困 数 。 

在 申请 的 内 存 空间 范围 之 内 的 某 个 地 方 ， 一 定 存 在 1 KB 的 倍数 的 
地 址 一 一 因为 我 们 申请 的 是 大 于 1 KB 的 内 存 空间 一 一 这 个 1 KB 的 倍数 
的 地 址 就 是 对 齐 地 址 。 非 常 重要 的 一 点 是 ， 所 获取 的 对 齐 地 址 是 由 操作 
系统 返回 给 我 们 的 ， 这 块 内 存 空 间 确定 可 以 使 用 。@ 是 将 这 个 地 址 记录 
下 来 的 步 又。 

岛 会 把 通过 中 申请 的 内 存 空间 释放 掉 。 由 于 只 是 申请 了 这 块 内 存 
空间 ， 还 没有 进行 实际 的 内 存 分 配 ， 所 以 释放 这 块 内 存 空间 的 性 能 开销 
很 小 。 

是 指定 通过 @@ 记 录 的 内 存 地 址 ， 再 次 申请 VM 堆 大 小 的 内 存 空 
间 。 由 于 实际 申请 内 存 空间 的 mmap () 和 VirtualAlloc() 可 以 用 于 指 
定 要 申请 的 空间 的 头 地 址 ， 所 以 这 里 使 用 它们 来 申请 。 

但 是 ，@ 中 能 够 使 用 的 地 址 ， 到 了 的 时 候 可 能 会 变 得 不 可 用 。 如 
果 中 失败 了 ， 则 返回 重新 开始 处 理 ， 直 到 成 功 为 止 。 


熙 孔明 对 象 的 分 配 


接 下 来 ， 我 们 看 一 看 从 分 配 在 VM 堆 上 的 区 域 中 分 配对 象 的 部 分 。 















































10.4.1 “对 象 分 配 的 流程 


从 调用 CollectedHeap 的 通用 接口 ， 到 实际 从 G1GC 的 VM 堆 上 
分 配对 象 的 流程 如 图 10.6 所 示 。 
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CollectedHeap Universe GlCollectedHeap G1AllocRegion HeapRegion 

CollectedHeap 

0b] allocatel) 
和 Universe: :heap () 


GlCollectedHeap 的 实例 
| 


mem allocate() 





» 
attempt allocation() 
allocate no bot updates() 


Contiguousspace 


:allocate impl 0 一 一 


而 给 区 域 的 内 存 空 间 
A 


[ed 


上 一 





对 象 的 初始 化 


已 分 配 的 对 象 




















图 10.6 ”对 象 分 配 的 流程 


首先 ，VM 调用 collectedHeap::obj allocate() 来 分 配对 象 。 
接 下 来 ，CollectedHeap 调用 Universe: :heap() 来 获取 在 启动 选项 
中 选择 的 VM 堆 类 (本 例 中 是 GlcollectedHeap) 的 实例 。 然 后 ， 
CollectedHeap 会 调用 所 有 VM 堆 类 共有 的 mem allocate() 方法 ， 
分 配 所 需 大 小 的 内 存 空间 。G1CollectedHeap 内 部 会 通过 一 系列 处 理 从 
VM 推 中 取出 一 部 分 内 存 空间 ， 并 最 终 将 这 块 空间 作为 已 分 配 的 内 存 空 
间 返 回 给 collectedHeap。 在 这 之 后 ，CollectedHeap 会 根据 指定 的 
对 象 种 类 进行 初始 化 工作 ， 然 后 将 对 象 返 回 给 VM。 











10.4.2_ 在 G1GC 的 VM 堆 中 分 配 内 存 








下 面 我 们 来 看 一 看 在 clcollectedHeap 中 进行 的 从 立 VM 堆 上 分 本 
内 存 的 过 程 。 首 先是 GlCollectedHeap 的 mem allocate() 方法 。 























share/vm/gc implementation/g1/glCollectedHeap.cpp 


830: HeapWord* 
ea eleomMeecteaqnapp :mmalocatel 
lle a wohsel Fl 


B882E boeu ners 
ees bool Sal 
834: bool* gc overhead limit was exceeded) { 





843: HeapWord* result = NULL; 
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845: result = attempt allocation (word size, &gc count before); 
849: ee sot 

850: evr e sul 

851: } 


/* 省 略 :执行 GC */ 
884: } 
第 845 行 代码 会 指定 对 象 的 大 小 并 调用 attempt_alloca 
如 果 这 时 无 法 分 配 内 存 ， 就 执行 GC， 在 VM 堆 中 清理 出 可 使 
块 。 此 处 省 略 对 这 部 分 的 讲解 。 











share/vm/gc implementation/g1l/glCollectedHeap.inline.hpp 


63: inline HeapWord* 
64: GlCollectedHeap::attempt allocation( 
Sl2zet Word size, 
55 ESmomedEnnEE eount De omeeey 


ETorn()s 








] 的 内 存 








{ 


vO HeapWord* result = mutator alloc region.attempt allocation!( 


word size, 


a false /* bot updates */); 


yas di (EEEuLE == MU) | 
党 result = attempt allocation slow!( 
word size, gc count before ret); 





mee 
To etn es, 
80: } 





第 70 行 代 码 中 的 attempt_allocation() 是 G1AllocRegion 的 成 
员 函 数 ， 它 会 尝试 从 区 域 中 分 配对 象 。G1A11ocRegion 是 管理 用 于 分 
配对 象 的 区 域 的 类 。 它 的 内 部 存放 着 一 个 ( 且 只 有 一 个 ) 有 可 用 空间 的 











区 域 。 








如 果 因 存放 在 GIA11ocRegion 内 的 区 域 中 的 可 用 空间 不 足 而 分 配 
失败 ， 那 么 第 73 行 会 调用 attempt allocation slow()。attempt 
allocation slow() 会 在 G1AllocRegion 中 设置 一 个 新 的 区 域 ， 并 按 
照 需 要 的 大 小 为 这 个 区 域 分 配 空间 。 这 段 处 理 的 内 容 与 主题 几乎 没有 什 




















么 关系 ， 故 而 省 略 。 
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share/vm/gc implementation/g1/g1lAllocRegion.inline.hpp 


55: inline HeapWord* G1lAllocRegion::attempt allocation( 
Szem te wordeey 


56: bool bot updates) { 
35 eapReaqronEalmocEeeoronEE el on 
625 HeapNcrqxEresUiEEE oarEalocatslalcceoicne 


word size, bot updates); 
63: if (result != NULL) { 


65 return result; 
G6% } 

68: return NULL; 

69: } 


第 59 行 代码 中 的 _alloc region 成 员 变量 ， 就 是 G1AllocRegion 
所 管理 的 具有 可 用 内 存 空间 的 区 域 。 第 62 行 代码 会 以 这 个 区 域 为 参数 
调用 par allocate()。 

在 par_allocate() 中 经 过 若干 次 函数 调用 后 ， 最 终 具有 可 用 内 存 
空间 的 区 域 ( HeapRegion ) 的 allocate impl() 成 员 艺 数 会 被 调用 。 

allocate impl () 是 在 HeapRegion 所 继承 的 ContiguousSpace 
类 中 定义 的 成 员 函 数 ， 它 扮演 的 是 实际 从 区 域 中 分 配 内 存 的 角色 。 


























share/vm/memory/space.cpp 


27 nne leapWord Contiouou paced: allocateninp 
Se ss Sle 


828: HeapWord* const end value) { 
838: HeapWord* obj = top(); 

S39k: if (pointer deltalend value, obj) >= size) { 
840: HeapWord* new top = obj + size; 

841: Set top (new top); 

843: return obj; 

844:  } else { 

845: return NULL; 

846:  } 

847 


传递 给 allocate_impl() 的 参数 size 的 不 是 对 象 大 小 的 字 节 数 而 
是 字 (word ) 数 。 传 递 给 另 一 个 参数 end_value 的 是 区 域内 块 (chunk ) 
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的 尾 地 址 。 

第 839 行 代码 中 的 pointer_dqelta() 函数 以 字 为 单位 返回 两 个 给 
定 地 址 之 间 的 差 值 ， 即 区 域内 可 用 内 存 空间 的 头 地 址 的 _top 和 end_ 
value 之 间 的 差 值 ， 然 后 以 字 为 单位 返回 可 用 内 存 空间 的 大 小 。 如 果 没 
有 大 于 等 于 size 大 小 的 可 用 空间 ， 则 第 845 行 代码 会 返回 NULL。 

如 果 区 域内 有 足够 的 可 用 空间 ， 那 么 第 840 行 代码 会 将 obj 移动 
size 个 单位 至 new_top， 然 后 在 第 841 行 中 将 new_top 设置 为 下 一 个 
可 用 块 的 头 地 址 。 接 着 ， 第 843 行 代码 会 返回 所 分 配 的 内 存 空间 的 头 地 
址 (obj )。 


ATLAB 


TLAB ( Thread Local Allocation Buffer， 线 程 本 地 分 配 缓冲 区 ) 是 对 
象 分 配 的 要 点 之 一 ， 本 节 将 简单 地 介绍 一 下 它 。 

VM 堆 是 所 有 线程 共享 的 内 存 空间 。 因 此 ， 在 从 VM 堆 上 分 配对 象 
时 ， 必 须 锁定 整个 VM 堆 ， 以 防止 其 他 线程 同时 分 配对 象 。 

但 是 让 不 同 线程 工作 于 不 同 的 CPU 核心 上 就 是 为 了 提升 效率 ， 要 
是 为 了 分 配对 象 而 让 它们 等 待 VM 堆 上 的 锁定 释放 ， 这 未 免 太 浪费 了 。 
而 TLAB 解决 这 个 问题 的 思路 ， 就 是 让 各 个 线程 分 别 持 有 自己 专用 的 分 
配对 象 的 缓冲 区 ， 从 而 减少 锁定 次 数 。 

当 一 个 线程 第 一 次 分 配对 象 时 ， 它 会 从 VM 堆 中 得 到 一 定 大 小 的 内 
存 空间 ， 然 后 作为 它 自己 的 缓冲 区 保存 起 来 。 这 块 缓冲 区 就 称 为 TLAB。 
这 样 一 来 ， 仅 在 分 配 TLAB 时 锁定 VM 堆 即 可 。 

当 同 一 个 线程 第 二 次 分 配对 象 时 ， 它 会 从 TLAB 中 分 配 目标 对 象 大 
小 的 内 存 。 这 时 其 他 线程 不 可 能 访问 这 块 缓存 ， 因 此 就 没有 必要 锁定 
VM 堆 了 (图 10.7)。 
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图 线程 1 专用 的 TLAB 
Ed 


线程 1 分 配对 象 
10.7 ”从 TLAB 中 分 配对 象 


M 堆 


TLAB 默认 不 启用 ， 程 序 员 可 以 在 Java 的 启动 选项 中 开启 它 并 指定 








其 大 小 。 








本 章 ， 我 们 来 看 一 看 在 VM 堆 上 分 配 的 对 象 的 数据 结构 。 这 些 被 分 





配 的 对 象 当 然 就 是 GC 的 回收 对 象 了 。 


Too ee 


oopDesc 类 是 所 有 GC 目标 对 象 的 抽象 基 类 。 继 承 自 oopDesc 的 类 
的 实例 都 是 GC 的 目标 对 象 。 
oopDesc 类 的 继承 关系 如 图 11.1 所 示 。 
















instanceOopDesc| |klassOopDesc| |methodOopDesc 





图 11.1 oopDesc 类 的 继承 关系 


oopDesc 类 中 定义 了 以 下 成 员 变 量 。 





share/vm/oops/oop.hpp 
61: class oopDesc { 


63 rivates 
64: volatile markOop _mark; 


65: union metadata { 
66: wideKlassOop _klass; 
(B78 narrowOop _compressed klass; 


68:  } metadata; 
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第 64 行 代码 中 的 _mark 变量 是 对 象 头 ( object header )。_mark 变 
量 中 不 仅 保存 了 标记 一 清除 算法 的 标记 ， 还 保存 了 对 象 所 需 的 其 他 各 种 


信息 。 








oopDesc 中 有 一 个 指向 自己 类 的 指针 ， 即 在 第 65 行 定义 的 联合 体 变 
量 _metadata。 在 大 部 分 情况 下 ， 这 个 联合 体 中 保存 的 是 第 66 行 中 的 
_klass 变量 的 值 。 顾 名 思 义 ， klass 保存 的 是 指向 对 象 类 的 指针 。 
第 67 行 中 的 _compressed klass 与 GC 无 关 ， 因 此 本 书 中 不 对 其 进行 


讲解 。 


在 HotSpotVM 9 























PF，oopDesc 实例 的 指针 (oopDescx ) 等 类 型 都 通 


过 typedef 定义 了 别名 。 


share/vm/oops/oopsHierarchy .hpp 


42: 
43: 
44: 
45: 
46: 
47: 
48: 
49: 
S50 
Sl 
三 
SD 
54: 


在 这 些 别名 中 ， 各 个 类 型 名 字 中 的 Desc 都 被 去 掉 了 。oopDesc 中 


typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
typedef 
EYEede 
typedef 
typedef 
typedef 
typedef 





class oopDesc* oop; 

class instanceOopDesc* instanceOop; 

class methodOopDesc* methodOop; 
class constMethodOopDesc* constMethodOop; 
class methodDataOopDesc* methodDataOop; 
class oarravoopDese* arrayOop; 
class objArrayOopDesc* objArrayOop; 
class typeArrayOopDesc* typeArrayOop; 
class constantPoolOopDesc* constantPoolOop; 
class constantPoolCacheOopDesc* constantPoolCacheOop; 
class klassOopDesc* klassOop; 
class markOopDesc* markOop; 

class compiledICHolderOopDesc* compiledICHolderOop; 





的 Desc 是 describe( 描述 ) 的 简称 。 也 就 是 说 ，oopDesc 的 意思 是 以 类 
来 描述 名 为 oop 的 实体 (对象 )， 本 章 将 遵从 oopDesc 等 的 实例 的 别名 
定义 ， 以 oop 的 形式 称呼 它们 。 


PklassOopDesc 类 


klassOopDesc 类 继承 自 oopDesc， 用 来 表示 Java 中 的 类 。 也 就 是 
的 java.lang.String 在 VM 中 是 klass0opDesc 类 的 实例 
这 个 类 名 中 的 一 部 分 之 所 以 不 是 class 而 是 klass, 是 


说 ，Java 站 





(klassOop )。 

















为 了 与 C++ 中 的 关键 字 区 分 开 。 这 个 方法 在 许多 编译 器 中 都 用 到 了 。 
按照 上 一 节 所 说 ， 所 有 对 象 都 会 持 有 klassoop。 另 外 , klassOoopDesc 
自身 也 继承 于 oopDesc， 因 此 也 持 有 成 员 变量 klassoop。 
Klassoop 的 特点 是 其 内 部 持 有 Xlass 类 的 实例 。 实 际 上 ， 
klassoopDesc 类 中 几乎 没有 什么 数据 信息 ，klassoop 不 过 是 在 内 部 持 
有 Klass 实例 的 一 个 盒子 而 已 。 


顾名思义 ，Klass 类 用 来 表示 类 型 信息 。Klass 的 实例 是 作为 
klassOop 的 一 部 分 被 创建 出 来 的 。 

Klass 是 各 种 数据 类 型 信息 的 抽象 基 类 。K1lass 的 继承 关系 如 图 
11.2 所 示 。 




























作 人 









instanceRefKlass| linstanceKlassKlass objArrayKlass| |typeArrayKlass 





arrayKlassKlass 
八 


11.2 Klass 类 的 继承 关系 


在 Klass 的 子 类 中 有 与 oopDesc 子 类 对 应 的 类 。 那 些 xxDesc 的 实 
例 中 存放 着 klass0op，klassoop 中 保存 着 对 应 XXDesc 的 XXKlass。 

上 一 节 提 到 ，klassOop 不 过 是 一 个 盒子 。 作 为 对 象 ， klassoop 可 
以 说 是 为 了 能 够 统一 操作 Klass 及 其 子 类 而 存在 的 接口 。 也 就 是 说 ， 从 
外 侧 看 都 是 kxlassoop， 但 其 内 部 实际 上 可 能 是 instanceKlass， 或 者 
symbolKlass 等 (图 11.3 )。 
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klassOop 


???- 





w instanceKlass 


| wm symbolKlass 


图 11.3 klassOop 是 装 Klass 的 盒子 


下 民明 类 之 间 的 关系 


接 下 来 ， 我 们 以 一 个 对 象 为 例 ， 详 细 地 看 一 看 oop 和 Klass 之 间 的 
关系 。 
假设 有 如 下 用 来 创建 string 类 的 对 象 的 Java 程序 (代码 清单 11.1 )。 


代码 清单 11.1 用 来 创建 String 对 象 的 Java 程序 


I Shomer hme = oe (Sestak (Os 
2 votLenout ml 











str.getClass()); // => java.lang.Sstring 
Bovetemoue Drill 
SEr getclass() getelassl() /=> avar lang Class 
4: System.out .pzintln( 
str.getClass() .getClass() .getClass());) // => java.lang.Class 


在 上 面 这 段 程序 中 ，string 类 的 对 象 会 被 存放 在 str 变量 中 。 此 
时 ,在 HotSpotVM 中 oop 和 klass 之 间 的 关系 如 图 11.4 所 示 。 





instanceOop=str klassOop=string klassOop=Class 

: ans ass _klass 

instanceOopDesc 2 klassOopDesc ww KlassOopDesc 
|instanceKlass instanceKlassKlass 


11.4 ”String 对 象 的 oop 














instanceOop 对 应 Java 中 对 实例 的 引用 。 图 11.4 左 端的 instanceoop 
表示 指向 执行 new String() 时 生成 的 instanceOopDesc 实例 的 指针 。 

instanceOop 在 自身 的 _klass 变量 (表示 对 象 是 哪个 类 的 变量 ) 
中 持 有 k1lassoop， 然 后 klassoop 中 又 存放 着 instanceKlass 的 实 














例 。 图 11.4 中间 的 klass0op 与 代码 清单 11.1 第 2 行 的 Java 中 的 
String 类 相对 应 。 

不 但 如 此 ， 图 中 间 的 klass0op ( 即 Java 中 的 string 类) 在 其 内 
部 还 持 有 另外 一 个 klassoop。 这 个 klassoop 的 内 部 存放 着 
instanceKlassKlass 的 实例 ， 也 就 是 图 11.4 右 端 的 klass0op。 它 对 
应 于 代码 清单 11.1 第 3 行 的 Java 中 的 class 类 。 

instanceKlassKlass 表 示 instanceKlass 的 类 。 持 有 
instanceKlassKlass 的 klassOop 将 自己 保存 在 _klass 中 ， 使 得 从 
instanceOop 开始 的 类 锁链 具有 收敛 性 。 查 看 代码 清单 11.1 可 以 发 现 ， 
第 3 行 中 getclass() 方法 的 结果 与 第 4 行 中 getClass () 方法 的 结果 
相同 。 这 是 类 锁链 在 instanceKlassKlass 上 一 直 循 环 的 缘故 。 


下 下 5 不 要 在 oopDesc 类 中 定义 虚 函 数 


绝 不 要 在 oopDesc 类 中 定义 C++ 的 虚 函 数 (virtual function )。 

如 果 定 义 了 虚 函 数 ，C++ 的 编译 器 会 在 该 类 的 实例 中 加 入 指向 虚 函 
数 表 2 (vtable ) 的 指针 。 如 果 在 oopDesc 中 定义 了 虚 函 数 , 那么 所 有 的 
对 象 都 会 被 额外 分 配 1 个 字 的 内 存 空间 。 这 会 造成 内 存 空间 使 用 率 降 
低 ， 因 此 在 oopDesc 类 中 不 能 定义 C++ 虚 函 数 。 

如 果 想 要 使 用 虚 函 数 来 定义 在 每 个 子 类 中 进行 不 同 处理 的 成 员 郴 
数 ， 那 么 就 不 能 在 oopDesc 类 中 定义 ， 而 是 必须 在 对 应 的 Klass 类 中 
定义 虚 函 数 。 

下 面 是 在 Klass 类 中 定义 虚 函 数 的 一 部 分 代码 。 这 里 定义 的 虚 函 数 
可 以 让 Klass 类 判断 自己 在 Java 中 是 一 个 具有 什么 作用 的 对 象 。 































































































share/vm/oops/klass.hpp 


172: class Klass : public Klass vtbl { 











9 虚 函 数 : 可 以 在 子 类 中 重新 定义 的 函数 。 从 C++ 语法 上 讲 ， 在 成 员 函 数 前 加 上 
virtual 就 可 以 定义 虚 函 数 。 
@) 虚 函 数 表 : 存放 着 程序 运行 时 会 调用 的 函数 信息 。 





中 
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// 是 Java 中 的 数组 吗 ? 


582: virtual bool oop is arzay() const { return false; } 





在 Klass 类 的 子 类 中 ， 上 面 这 个 成 员 函 数 的 重 定义 如 下 所 示 。 





shara/vm/oops/arrayKlass .hpp 


35: class arrayKlass: public Klass { 
47: bool oop is array() const { return true; } 


接着 ，oopDesc 类 中 会 调用 Klass 的 虚 函 数 。 


share/vm/oops/oop.inline.hpp 


139: inline Klass* oopDesc::blueprint() const { 


return klass()->klass part (); } 


146: inline bool oopDesc::is array() const { 


return blueprint ()->oop is array(); } 








第 139 行 代码 中 的 plueprint () 是 从 klassoop 中 取出 Klass 实 


例 的 成 员 函 数 。 第 146 行 代码 会 调用 通过 Klass 的 虚 函 数 定 义 的 成 员 函 


的 oop_is_array () 进行 处 理 的 ,最终 返回 false。 而 如 果 调 用 的 是 


这 里 虽然 调用 的 是 oop 的 is_array ()， 但 实际 是 由 对 应 的 Klass 








array0op 的 is_array()， 则 由 对 应 的 arrayKlass 的 oop_is_ 
artay() 进行 处 理 ， 最 终 返 回 true。 





尽管 在 Klass 中 定义 虚 函 数 会 导致 klassOop 中 附带 有 一 个 指向 虚 








函数 表 的 指针 ， 但 是 在 Java 中 ， 类 的 数量 比 对 象 的 数量 少 ， 因 此 没有 问题 。 


11.6 


VM 


11.1 节 中 简单 提 到 过 “对 象 头 ”， 这 里 再 稍微 详细 地 讲解 一 下 。 在 
1， 对 象 头 用 markoopDesc 类 来 表示 。 
对 象 头 中 主要 有 以 下 信息 。 

















e 对 象 的 散 列 值 
e 年 代 (用 于 分 代 GC ) 


e 锁定 标志 位 
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11.6.1 奇妙 的 markOopDesc | 


各 的 mark0opDesc 类 的 代码 非常 奇妙 。 我 对 C++ 不 是 很 
熟悉 ， 泗 经 在 看 到 mark0opDesc 类 的 代码 后 由 应 地 感叹 :“ 原 来 代 
码 还 能 这 么 写 啊 !” 

markOopDesc 类 仅 用 1 个 字 的 数据 作为 对 象 头 。 它 的 使 用 方法 大 致 
如 代码 清单 11.2 所 示 。 


代码 清单 11.2 markOopDesc 的 使 用 方法 


makOcepEsSscxEnsadEm 

















2 nnEDET Esomn wornde 1 

3 

4: header = (markOopDesc*)some word; 
5: header->is marked(); // 查询 标记 状态 


第 1 行 代 码 定 义 了 一 个 局 部 变量 mark0opDesc*， 第 2 行 代码 通 
过 uintptr tt 类 型 的 局 部 变量 some_word， 定 义 了 一 个 大 小 为 1 个 字 
的 数据 。 

第 4 行 代码 将 some_word 的 类 型 转换 为 markoopDesc*， 第 5 行 代 
码 进 行 函数 调用 。some_word 是 1。 也 就 是 说 ， 第 $ 行 代码 是 将 1 这 个 
地 址 上 的 数据 当 作 实例 来 调用 函数 的 ， 所 以 很 有 可 能 会 发 生 段 错误 
(segmentation fault )， 对 吧 ? 

实际 上 ， 从 mark0opDesc 类 的 实现 上 来 看 ， 它 自身 不 会 被 实例 化 ， 
而 只 会 使 用 自己 的 地 址 (this )。 也 就 是 说 ， 它 是 一 个 将 自身 的 地 址 
作对 象 头 信息 的 类 。 






































aa 


Share/vm/oops/markOop .hpPp 


104: class markOopDesc: public oopDesc { 
MOE: ae 


Os unt pt vale ll eonst recvrn tor ns 
221: bool is marked() const { 
22D: returnn(mask bits(valuel() lock mask ln place) 


== marked value); 
23s 


有 许多 成 员 函 数 使 用 了 第 107 行 中 返回 this 的 value ()。 第 221 
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行 到 第 223 行 中 用 来 返回 对 象 是 否 被 标记 的 成 员 函 数 is_matked() 就 
是 一 个 例子 ， 我 们 来 看 一 看 它 。 第 222 行 代码 会 对 通过 value () 得 到 的 
1 个 字 的 数据 进行 位 屏 项 ， 然 后 判断 屏蔽 位 是 否 为 1， 并 返回 判断 结果 。 

在 第 104 行 代码 中 ，mazkoopDesc 继承 了 ooppesc 类 ， 不 过 它 完 
全 没有 用 到 继承 下 来 的 成 员 。 尽 管 markoopDesc 从 oopDesc 继承 了 
几 个 成 员 变 量 , 但 mark0opDesc 是 不 会 被 实例 化 的 ， 因 此 也 无 法 使 用 
它们 。 那 么 ， 为 什么 还 要 多 此 一 举 地 继承 oopDesc 类 呢 ? 原因 写 得 非常 


清楚 。 





















































share/vm/oops/markOop.hpp 


32: // Note that the mark is not a real oop but just a word. 

33: // It is placed in the oop hierarchy for historical reasons. 
VBE) 
// 请 注意 mark 并 不 是 真正 的 oop， 只 是 一 个 字 。 
// 它 之 所 以 继承 自 oop， 是 历史 遗留 问题 。 












































原来 如 此 。 嗯 ， 那 没有 办 法 。 如 果 是 历史 遗留 问题 ， 还 真 没 办 法 。 
我 个 人 认为 ， 此 处 没有 必要 弄 得 这 么 复杂 ， 简 单 地 定义 一 个 带 有 1 
个 字 的 成 员 变 量 的 类 就 可 以 了 。 之 所 以 没有 那么 做 ， 可 能 是 因为 在 C++ 
中 ， 编 译 吉 会 分 配 多 余 的 内 存 空 间 ( vtable 等 ) 不过， 现在 这 种 写法 的 
代码 并 不 方便 阅读 。 





























11.6.2 ”前 向 指针 

作为 对 象 头 的 使 用 示例 ， 我 们 来 看 一 看 复制 算法 中 前 向 指针 的 使 用 
方法 。 

下 面 是 G1GC 中 复制 对 象 的 成 员 函 数 的 代码 。 




















share/vm/gc_implementation/g1/g1CollectedqHeap .cpp 

4369: oop G1ParCopyHelper::copy to survivor space(oop old) { 
WO Se word sz = old->size(); 

4382: HeapWord* obj ptr = par scan state 


-allocate (alloc Purpose wor 
4383: oop obj = op (ob] ptEr); 
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4395: oop forward ptr = old->forward to atomic(obj); 
4396: if (forward ptr == NULL) { 

// 对 象 的 复制 
4397 : Copy::aligned disjoint words ( (HeapWord*) old, 


©bIEpEr worndEsz)y 


4457: } 
4458: ealavhen (lo) 
4459: } 





参数 接收 的 是 指向 被 复制 对 象 的 指针 (old)。 第 4370 行 代码 用 来 
计算 对 象 的 大 小 ， 然 后 第 4382 行 代 码 会 分 配 一 个 同样 大 小 的 新 对 象 。 
第 4383 行 代 码 用 来 将 新 分 配 的 内 存 空间 的 地 址 转换 为 oop。 

这 里 有 必要 对 第 4383 行 代码 中 的 oop (p) 部 分 (在 本 例 中 , p 是 
obj_ptr ) 多 讲 一 点 。 在 C++ 中 ,我 们 能 够 以 与 函数 调用 相同 的 语法 显 
式 地 进行 类 型 转换 。 转 换 与 显 式 转换 所 能 够 接收 的 参数 数量 不 同 。 转 换 
本 质 上 只 能 接收 一 个 参数 ， 而 显 式 转换 可 以 接收 多 个 参数 。 不 过 ， 
oop (p) 只 接收 一 个 参数 ， 因 此 将 其 理解 为 (oop)p 也 是 可 以 的 。 

第 4395 行 的 forwad_ to_atomic() 是 创建 前 向 指针 的 成 员 函 数 。 
该 函数 存在 并 行 的 可 能 性 ， 如 果 在 中 途 有 其 他 线程 先进 行 了 复制 ， 那 么 
它 会 返回 NULL ; 如 果 正 确 地 设置 了 前 向 指针 ， 则 第 4397 行 代码 会 实际 
地 将 对 象 的 内 容 复 制 过 来 ， 然 后 第 4458 行 代码 会 返回 复制 出 的 对 象 的 
内 存 地 址 。 

下 面 我 们 来 看 一 看 forwad_to_atomic() 成 员 函 数 的 实现 。 






















































































share/vm/oops/oop.pcgc.inline.hpp 

76: inline oop oopDesc::forward to atomic(oop p) { 

了 9 markOop oldMark = mark(); 

BO0F markOop forwardPtrMark = markOopDesc::encode pointer as mark(p); 
Bl markOop curMark; 

86: while (!oldMark->is marked()) { 

BE curMark = (markOop)Atomic::cmpxchg ptr( 


forwardPptrMark, & mark, oldMark); 


89: if (curMark == oldMark) { 
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3905 return NULL; 

Sl } 

95; oldMark = curMark; 
96:  } 

CS return forwardee(); 
98: } 


第 79 行 代码 将 被 复制 的 对 象 的 头 保存 在 局 部 变量 ol1dMark 中 。 接 
着 ,第 80 行 代 码 将 新 复制 出 的 对 象 的 地 址 编码 到 前 向 指针 中 。 稍 后 ， 
会 讲解 这 个 静态 成 员 函 数 的 内 容 。 
然后 ， 第 86 行 至 第 96 行 代码 会 使 用 CAS 命令 将 前 向 指针 写 人 被 
复制 的 对 象 的 _mark 中 ， 这 是 一 步 原 子 操作 ( atomic operation )。 第 97 
行 的 forwardee () 会 解码 前 向 指 针 ， 并 将 其 返回 给 调用 方 。 这 个 函数 
的 作用 仅仅 是 将 后 面 要 讲 到 的 “标记 位 ”去 掉 而 已 。 
下 面 是 用 来 编码 前 向 指针 的 encode_pointer as_mark () 的 实现 。 


































































































share/vm/oops/markOop.hpp 
B62 inline static markOop encode pointer as mark (void* p) { 
return markOop (p)->set marked(); 
} 
它 只 是 将 接收 到 的 指针 转换 为 markoop， 然 后 调用 set_marked ()。 


share/vm/oops/markOop.hpp 


158: enum { locked value = 
te 

161: marked value 和 
WR 

L6G }; 

333: markOop set marked() { 


return markOop ( (Value() & ~lock mask in place) | marked value); 
) 
set_marked() 是 用 来 将 最 低 的 2 位 设置 为 1 (设置 标记 位 ) 的 成 员 
函数 。 这 里 利用 了 “对 象 的 地 址 经 过 对 齐 后 ， 其 最 低 的 2 位 一 定 为 0” 
的 特点 。 
根据 这 个 标记 ， 我 们 可 以 判断 一 个 对 象 是 否 已 经 被 复制 。 
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share/vm/oops/oop.inline.hpp 


641: inline bool oopDesc::is forwarded() const { 
644: return markly =esmmarkeseale 
645: } 





G1GC 或 其 他 复制 GC 会 调用 上 面 的 is_forwarded () 来 检查 标记 
位 ， 不 会 对 已 经 被 标记 的 对 象 再 次 进行 复制 。 











2 HotSpotVM 的 线程 管理 





在 接 下 来 的 几 章 中 ， 我 们 将 学 习 HotSpotVM 的 线程 管理 。 我 在 算 
法 篇 中 讲 过 ，G1GC 是 一 种 结合 了 并 行 GC 和 并 发 GC 的 GC 算法。 并 
行 GC 和 并 发 GC 是 通过 它们 各 自 的 线程 实现 的 ， 因 此 如 何 管理 多 线程 
是 实现 中 的 重点 。 

本 章 将 介绍 HotSpotVM 的 线程 管理 中 接近 操作 系统 的 底层 部 分 。 


上 忆 呈 线程 操作 的 抽象 化 


Windows 和 Linux 各自 都 有 用 来 调用 操作 系统 线程 的 库 。 在 
Windows 上 我 们 可 以 使 用 Windows API 调用 线程 ， 而 在 Linux 上 可 以 使 
] 实 现 了 POSIX 线程 标准 的 Pthreads 库 调 用 线程 。 

在 HotSpotVM 内 有 一 个 能 够 以 相同 方式 调用 不 同 操作 系统 的 线程 
的 抽象 层 。 为 了 能 够 在 HotSpotVM 内 轻松 调用 线程 ， 开 发 者 们 在 设计 
上 花 了 不 少 工夫 。 


















































了 克基 Thread 类 














在 HotSpotVM 内 操作 线程 的 基本 功能 是 由 Thread 类 实现 的 ， 而 决 
定 线 程 行为 的 是 继承 自 Thread 类 的 子 类 的 实现 。 图 12.1 展示 了 
Thread 类 的 继承 关系 。 
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人 







ThreadShadow 
人 


图 12.1 _ Thread 类 的 继承 关系 





由 于 Thread 类 继承 自 CHeapobj 类 ， 所 以 它 的 实例 直接 分 配 在 C 
的 堆 内 存 空间 上 。 
Thread 类 中 定义 了 一 个 虚 函 数 run () 。 





share/vm/runtime/thread.hpp 
94: class Thread: public ThreadSshadow { 


和 
4295TIEEDalR7OnOEEUOTOE 
run () 函数 会 在 创建 出 的 线程 上 运行 。 继 承 自 Thread 类 的 子 类 负 
责 实 现 run () ， 在 其 中 定义 实际 要 在 线程 上 进行 的 处 理 。 
Thread 类 的 父 类 Threadshadovw 会 对 线程 运行 中 发 生 的 异常 进行 统 
一 处 理 。 
Thread 类 的 子 类 JavaThread 表示 的 是 在 Java 语言 级 别 运 行 的 线 
程 。 当 开发 者 创建 一 个 Java 线程 时 ，HotSpotVM 内 部 就 会 创建 一 个 
JavaThread 类 的 实例 。 不 过 JavaThread 类 和 GC 没有 什么 紧密 关系 ， 
因此 本 书 不 会 详细 讲解 它 。 
NameThread 类 支持 线程 的 命名 。 我 们 可 以 为 NameThread 类 及 其 子 
类 的 实例 设置 一 个 唯一 的 名 字 。 那 些 被 用 作 GC 线程 的 类 都 是 通过 继承 
NameThread 类 而 实现 的 。 


不测 线程 的 生命 周期 


让 我 们 按照 顺序 来 看 一 看 线程 是 如 何 被 创建 出 来 ， 处 理 是 如 何 开 始 
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和 结束 的 。 下 面 是 一 个 线程 的 生命 周期 。 








GD 创建 Thread 类 的 实例 

@) 创建 线程 ( os: :create_ thread() ) 

@) 开始 线程 处 理 ( os : :start_thread() ) 
由 结束 线程 处 理 
G@) 释放 Thread 类 的 实例 











首先 ， 在 阶段 四 创建 Thread 类 的 实例 。 这 时 会 初始 化 用 来 管理 线 
程 的 资源 ， 并 进行 创建 线程 前 的 准备 。 
关于 @、 四 和 @ 由 ， 请 参考 图 12.2。 








| 结束 线程 处 理 


人 


建 出 的 线程 。 上 ~- 
暂停 中 a 








主线 各 





创建 线程 开始 线程 处 理 
12.2 创建 线程 、 开 始 处 理 、 结 束 处 理 的 流程 


在 阶段 包 实 际 创建 线程 。 这 个 阶段 创建 出 的 线程 是 处 于 暂停 状 
态 的 。 

在 阶段 包 启 动 暂 停 的 线程 。 在 这 个 阶段 ，Thread 类 的 子 类 所 实现 
的 run() 成 员 函 数 会 在 创建 出 的 线程 上 被 调用 。 

阶段 由 中 run () 成 员 函 数 的 处 理 结束 后 ， 线 程 的 处 理 就 会 结束 。 

在 阶段 @ 释 放 Thread 类 的 实例 。 这 时 ， 析 构 函 数 还 会 释放 线程 所 
使 用 的 资源 。 





























12.3.1_OSThread 类 - 
Thread 类 中 定义 了 一 个 存放 oSThread 类 的 实例 的 成 员 变量 
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_osthread。0SThread 类 中 存 有 操作 线程 时 所 需 的 依赖 于 各 个 操作 系 
统 的 线程 信息 。 在 创建 线程 时 ，0sThread 类 的 实例 会 被 创建 并 存放 在 
_osthread 成 员 变量 中 。 

如 下 所 示 ,， 在 定义 0SThread 类 时 ， 需 要 根据 不 同 目标 操作 系统 读 
取 不 同 的 头 文件 。 





share/vm/runtime/osThread.hpp 


GL: 


GB 


L032. 

T1033. 
104: 
Us 
LQG: 


class OSThread: public CHeapobj { 


// Platform dependent stuff 
#ifdef TARGET OS FAMILY linux 
Hoineluden omhmeadml nun 
#endif 
#ifdef TARGET OS FAMILY solaris 
Hel oneads oer 
: #endif 
: #ifdef TARGET OS FAMILY windows 
: # include "osThread windows.hpp" 
: #endif 








下 面 我 们 来 看 一 看 Linux 的 部 分 头 文件 。 


SE 


49 : 


pthread t 是 在 Pthreads 


linux/vm/osThread linux.hpp 


Penreadne tnneade, 














volatile ThreadState _state; // 线程 的 状态 





P 会 用 到 的 数据 类 型 。 pthread id 中 存 


放 的 是 通过 Pthreads 操作 线程 时 所 需 的 pthread 局 于 ID。 
此 外 ,osThzread 类 中 还 定义 了 保存 线程 当前 状态 的 成 员 变 量 


_Sstateo。 





share/vm/runtime/osThread.hpp 


44: 
45: 
46: 
47: 
48 : 
49 : 


enum ThreadState { 


state 成 员 变 量 中 的 值 是 在 Threadstaet 中 定义 的 枚 举 值 。 





ALLOCATED, // 已 经 分 配 但 还 未 初始 化 的 状态 














INITIALIZED， // 已 经 初始 化 但 处 理 还 未 


始 的 状态 











RUNNABLE, // 处 理 已 经 开始 ， 可 以 启 双 
MONITOR WAIT，// 等 待 监视 器 锁 
CONDVAR WAIT, // 等 待 条 件 变量 



































的 状态 
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50: ”OBJECT WAIT， // 等 待 Object .wait () 的 调 
51: ”BREAKPOINTED，// 停止 在 断 点 处 
































ED SLEEPING, // Thread.sleep() 中 
53: ZOMBIE // 虽 满 足 条 件 ， 但 还 未 回收 的 状态 
54: }; 





_state 成 员 变 量 是 各 个 操作 系统 通用 的 变量 ，Threadstate 的 值 
也 是 各 个 操作 系统 通用 的 枚 举 值 。 


上 吉明 Windows 线程 的 创建 
我 们 来 看 一 看 VM 在 各 个 操作 系统 上 是 如 何 操作 线程 的 。 首 先是 
Windows 上 线程 的 创建 。 
创建 线程 的 成 员 函 数 定义 在 os::create thread() 中 。 
os::create_thread() 内 所 进行 的 处 理 的 概要 如 下 所 示 。 











中 创建 0SThread 的 实例 

@) 确定 在 线程 中 要 使 用 的 栈 大 小 
@ 创建 线程 ， 保 存 线 程 信息 

由 将 线程 状态 变 为 INITIALIZED 























下 面 我 们 来 看 一 看 os : :create thread() 的 实现 。 











os/windows/vm/os windows.cpp:0s::create thread() 


5 ooo createnthneead(ineea enveade 
TneeacLly pent en 
size t stack size) { 

区 unsigned threadBid 

Ss 

513: ”// 中 创建 osThread 的 实例 

514 : OSThread* osthread = new OSThread (NULL, NULL); 

528: thread->set osthread (osthread); 





首先 ， 创建 0SThreag 的 实例 ， 然 后 将 创建 出 的 实例 保存 在 通过 参 
数 传 人 的 Thread 实例 中 。 








os/windows/vm/os windows.cpp:0s::create thread() 
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// @ 确 定 在 线程 中 要 使 用 的 栈 大 小 








S30 tacrys ze ol 

531: switch (thr type) { 

SD cease os : Javanthreads: 

533: // 可 以 通过 -Xss 选 项 修改 

534: mtvemead Ea ecreauey 0 

5 Sbackye ze eaveanhmead StackiSne sacie reatel, 
S36 break; 

Ss cease os compnlere nmead 

538: if (CompilerThreadstacksize > 0) { 

S30 Seackyenze ee (en (Com eanread tack oe 
540: break; 

541 } 


// 如 果 ComplierThreadSstackSize 是 0， 则 将 VMThreadstackSize 
// 设置 为 栈 大 小 


543 : ease os vmBtheeads 
544: ease Os :pqcatnneade 
545: ease osegemtuneads 
546: case os::watcher thread: 
547: Bf Mnreadstacks nze 0 
Seackaenze (nen Vmeadl ta ze 
548: break; 
549: } 
550 








然后 ， 该 函数 会 确定 在 线程 中 要 使 用 的 栈 大 小 。 如 果 通 过 参数 接收 
到 的 栈 大 小 ( stack_size ) 为 0， 则 需要 根据 线程 的 种 类 ( thr_type ) 
确定 合适 的 栈 大 小 。 这 段 处 理 的 目的 在 于 通过 指定 要 使 用 的 栈 大 小 范围 
来 节省 内 存 消耗 。 
虽然 ComplierThreadStackSize 和 VMThreadStackSize 是 由 各 
个 操作 系统 决定 的 ， 但 程序 员 可 以 通过 Java 的 启动 选项 指定 JavaThread:: 


stack size at create()。 





























bat 



































os/windows/vm/os windows.cpp:0s::create thread() 





(3) 创 建 线程 ， 保 存 线程 信息 
573: #ifndef STACK SIZE PARAM IS A RESERVATION 
574: #define STACK SIZE PARAM IS A RESERVATION (0x10000) 








5 emda 

SMe 

5 HANDLE thread handle = 

578: (HANDLE) beginthreadex (NULL, 
SO (unsigned)stack size, 


Ss (nsiloaneane stdcall ven vont 
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581: thread, 
DBZ CREATE SUSPENDED | STACK SIZE PARAM IS A RESERVATION, 
S83 &thread id); 


606: osthread->set thread handle (thread handle); 
So thead etmead na 
接 下 来 ，os: :create thread() 会 调用 _beginthreadex() 困 数 
( Windows API ) 创建 线程 。 传 递 给 _beginthreadex() 函数 的 参数 的 是 
以 下 数据 。 























人 @ 线程 的 安全 属性 。 如 果 是 NULL， 则 不 指定 任何 安全 属性 
@) 栈 大 小 。 如 果 是 0， 则 使 用 与 主线 程 相同 的 值 

@) 要 在 线程 上 处 理 的 函数 的 地 址 

要 传递 给 在 @ 中 指定 的 函数 的 参数 

线程 的 初始 状态 。CREATE SUSPENDED 表示 暂停 状态 

(GO) 指向 接收 线程 ID 的 变量 的 指针 























除 此 之 外 ，@@ (线程 的 初始 状态 ) 中 还 指定 了 STACK_SIZE_ 
PARAM IS A _RESERVATION 标志 位 。 下 一 节 将 详细 讲解 这 个 标志 位 。 

第 606 行 和 第 607 行 用 来 将 创建 线程 时 获取 的 thread_handle 和 
thread id 设置 到 osThread 实例 中 。 








os/windows/vm/os windows.cpp:0s::create _ thread () 


四 将 线程 状态 变 为 INITIALIZED 
610: osthread->set state (INITIALIZED); 


613: et TUS 
614: } 


最 后 ， 将 线程 的 状态 变 为 INITIALIZED, os::create thread() 
的 处 理 就 结束 了 。 





STACK_SIZE_PARAM_IS_A_RESERVATION 标志 位 


根据 代码 中 的 注释 ， 设 置 beginthreadex() 的 stack_size 时 会 
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出 现 问题 ， 而 STACK SIZE PARAM IS A RESERVATION 标志 位 就 是 为 了 
解决 这 个 问题 而 设计 的 。 这 里 我 简单 地 翻译 一 下 代码 (os /windows/ 


vm/os_windows .cpp ) 中 的 注释 。 











MSDN 文档 中 写 明 的 处 理 与 实际 的 处 理 有 些 不 同 。 beginthreadex () 
的 stack_size 定义 的 并 不 是 线程 的 堆 大 小 ， 而 是 最 开始 提交 的 内 存 大 
小 。 栈 大 小 是 通过 执行 文件 的 PE 头 “ 定义 的 。 假 设 启动 器 (launcher ) 
的 栈 大 小 的 默认 值 是 320 KB。 这 时 如 果 stack size 的 值 在 320 KB 以 
下 ， 那 么 对 线程 的 栈 大 小 没有 任何 影响 。 如 果 stack_size 的 值 比 PE 
头 的 默认 值 (320 KB ) 大 ， 那 么 栈 大 小 会 向 最 近 的 1 MB 的 倍数 对 齐 ， 
而 这 会 对 最 开始 提交 的 内 存 大 小 有 影响 。 也 就 是 说 ， 当 stack size 的 
值 比 PE 头 的 默认 值 大 时 ， 可 能 会 导致 内 存 使 用 量 大 幅 增长 。 原 因 是 不 
仅 栈 空间 会 增长 数 MB ， 而 且 整 个 内 存 空间 还 会 被 提前 分 配 。 

最 终 Windows XP 为 CreateThread () 增加 了 一 个 STACK SIZE 
PARAM IS A RESERVATION 标志 位 ， 它 的 作用 是 告诉 CreateThread () 
函数 “请 将 stack _ size 当 作 栈 大 小 "。 不 过 ，JVM 用 到 的 是 C 运行 时 
库 ， 无 法 根据 MSDN 的 说 明 直 接 调用 CreateThread ()2 。 

不 过 ， 我 们 还 有 一 个 好 消息 : 这 个 标志 位 在 _beginthreadex() 同 
样 起 作用 哟 。 





在 一 帘 Windows API 的 黑暗 面 之 后 ， 想 必 大 家 已 经 明白 了 指定 
STACK SIZE PARAM IS A RESERVATION 为 beginthreadex() 的 参数 
的 理由 。 


PA 和 Windows 线程 的 处 理 开 始 


父 线程 会 在 os : :create_thread() 处 理 结束 后 调用 os::start_ 
thread ()， 让 创建 的 线程 开始 处 理 。 这 个 函数 是 各 个 操作 系统 的 通 























中 PE 头 是 一 个 定义 在 执行 文件 中 的 位 置 ， 保 存 了 执行 时 所 需 的 信息 。 
@ 因此 调用 的 是 _beginthreadex ()。 
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] 子 数 。 





share/vm/runtime/os.cpp 
695: void os::start thread(Thread* thread) { 


698: OSThread* osthread = thread->osthread(); 
699: osthread->set state (RUNNRABLE) ; 

A pd start thread (thread); 

Oa: 


第 669 行 代 码 将 线程 的 状态 设置 为 RUNNABLE， 第 700 行 代码 调用 
os::pd_start_thread()。 在 不 同 的 操作 系统 上 , os::pd_start_ 
thread() 的 实现 也 不 同 。 





os/windows/vm/os windows.cpp 


2975: void os::pd start thread(Thread* thread) { 
29%6. DWORD ret = ResumeThread (thread->osthread()->thread handle()); 


2982: } 











第 2976 行 代码 调用 ResumeThread() 国 数 ( Windows API )， 让 和 暂 
时 处 于 中 断 状态 的 线程 继续 执行 。 在 线程 上 首先 执行 的 函数 是 作为 参数 
传递 给 beginthreadex() 的 java start()。 





os/windows/vm/os windows.cpp 


391: static unsigned stdcall java start (Thread* thread) { 


421: thread->run (); 
435: ecw os 
26 } 





第 421 行 代码 会 执行 在 继承 自 Thread 类 的 子 类 中 定义 的 run () 
了 抑 数 。 


12.5.1 _ 有 效 使 用 缓存 行 


在 java_start () 因数 中 有 一 段 乍 看 起 来 黄 名 其 妙 的 代码 ， 上 一 闻 
我 省 略 掉 了 。 
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os/windows/vm/os_ windows.cpp 


391: static unsigned stdcall java start (Thread* thread) { 
BO Sebatimnt counsere 下 


D088 nee os eu nent recessu (0 
399: alloca(((pid ~ counter++) & 7) * 128); 
421: Earead mon 

435: eam 0 

436: } 





这 里 简单 地 讲解 一 下 第 397 行 至 第 399 行 代码 。_alloca () 是 在 栈 
空间 中 分 配 内 存 的 函数 。 传 递 给 a1l1loca () 的 参数 的 值 是 通过 每 次 调 
用 java_start() 时 从 [0..7] 范围 内 算出 的 一 个 值 ( 这 个 值 每 次 会 加 
1 ) 乘 以 128 得 到 的 。 第 一 次 的 值 是 由 进程 ID 决定 的 。 简 单 来 说 就 是 以 
进程 或 线程 为 单位 ， 每 次 以 128 的 差 值 传递 给 _alloca()。 

这 段 处 理 可 以 分 散 栈 所 使 用 的 CPU 缓存 行 的 位 置 。 

CPU 缓存 行 是 缓存 中 所 保存 的 数据 的 一 个 单位 。 如 图 12.3 所 示 ， 
几乎 所 有 的 缓存 会 被 分 割 为 数字 节 的 缓存 行 。CPU 会 将 频繁 使 用 的 数据 
以 缓存 行为 单位 存储 起 来 。 















































ge | pe 


L1 缓存 





缓存 行 
(7 条 ) 











L2 缓存 

















图 12.3 ”缓存 行 


现在 许多 CPU 都 有 两 级 缓存 ， 最 接近 核心 的 是 LI1 缓存 (1 级 缓存 )， 其 
次 是 L2 缓存 。 缓 存 以 缓存 行为 单位 存放 数据 。 


必 
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F 发 者 在 解决 问题 时 担心 的 是 “在 多 个 会 创建 相同 栈 跟 踪 〈 stack 





trace ) 的 线程 已 被 创建 出 来 的 情况 下 ， 绥 存 行 的 使 用 位 置 可 能 会 出 现 分 
布 不 均 的 问题 "。 如 果 跟 踪 栈 是 相同 的 ， 那 么 各 栈 帧 ( stack frame ) 的 地 








址 间隔 就 会 相同 ， 存 放 栈 帧 的 缓存 行 就 可 能 会 出 现 偏 差 。 























此 外 ， 双 核 和 四 核 的 CPU 几乎 是 共享 L2 缓存 的 。 因 此 如 果 陷 和 上 

















j 这 种 状态 ， 那 么 在 访问 栈 时 ， 线 程 间 会 发 生 争夺 缓存 的 问题 ， 这 会 导 





致 线程 的 处 理 速度 下 降 。 而 旦 ， 在 将 CPU 处 理 器 虚拟 为 两 个 处 理 器 的 
超 线 程 技 术 ( Hyper-Threading，HT ) 中 ， 这 两 个 虚拟 处 理 需 之 间 是 共享 
缓存 的 ， 因 此 速度 下 降 的 问题 会 更 加 严重 。 

所 以 ， 开 发 者 通过 第 397 行 至 第 399 行 代码 ， 让 线程 在 稍微 偏离 原 
位 置 的 地 址 开始 分 配 栈 内 存 ， 以 避免 缓存 行 的 使 用 位 置 出 现 不 均 。 


PA Linux 线程 的 创建 


下 面 我 们 来 看 一 看 在 Linux 环境 下 线程 是 如 何 被 创建 出 来 的 。 对 于 
与 12.4 节 介 绍 过 的 内 容 相 重 复 的 部 分 ， 本 节 将 不 再 费 述 。 


os/ 


866: 


8705 


8765 























linux/vm/os_ Linux.cpp:os::ctreate thread() 

booliosi createnthread(lhread tnread, 
mimeadly etnet en 
size t stack size) { 


OSThread* osthread = new OSThread (NULL, NULL); 


osthread->set thread type(thr type); 





B77 


B79s 


// 最 初 的 状态 是 ALLOCATED 
osthread->set state (ALLOCATED); 





880: 


881: 


thread->set osthread(osthread); 


8825 


884: 
885: 
886: 





// 初始 化 线程 属性 

PenreadEattemte ot 

pehreadat er in (ea 

pthread attr setdetachstate(&attr, PTHREAD CREATE DETACHED); 














// 省 略 : 确定 在 线程 中 使 用 的 栈 大 小 
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S23 Ereadatt SekEgnadgsnzell 
&attr, os::Linux::default guard size(thr type)); 
924: 

第 870 行 至 第 881 行 代码 会 初始 化 osthread。os::create_ 
thread() 在 Linux 上 同样 会 通过 set_state() 设置 线程 状态 ， 只 不 过 
在 Linux 上 是 将 其 设置 为 ALLOCATED， 不 同 于 Windows 上 的 
INIITIADIZED。 

第 884 行 和 第 885 行 代码 会 初始 化 线程 的 属性 。pthread attr t 
是 存放 pthread 的 属性 的 结构 体 。 第 885 行 的 pthread attr init() 隐 
数 将 attr 变量 初始 化 为 由 Pthreads 确定 的 默认 值 。 

第 886 行 代 码 中 的 pthread attr setdetachstate() 会 设置 分 离 
( detach ) 状态 这 个 线程 属性 。 如 果 将 其 设置 为 PTHREAD _CREATE_ 
DETACHED 标志 位 ， 那 么 被 创建 出 来 的 线程 将 处 于 分 离 状态 。 处 于 分 离 
状态 的 线程 会 在 结束 处 理 后 自动 释放 自身 的 资源 。 不 过 ， 处 于 分 离 状 态 
的 线程 是 在 和 主线 程 分 离 的 状态 下 执行 处 理 的 ， 因 此 我 们 无 法 结合 
(join ) 处 于 分 离 状态 的 线程 。 

第 923 行 代 码 中 的 pthread attr setguardsize() 会 指定 栈 的 警 
戒 缓 存 大 小 。 关 于 这 一 点 ， 我 将 在 12.6.1 节 中 详细 讲解 。 







































































os/linux/vm/os linux.cpp:0s::create thtzead () 


ODD ThreadState state; 





gas 

ans 炎 

934 : pehnreadmt rd 

935: mnteerete tnreadmereatel(er rod eat 
(ong (Gong oavanstartee 
thread); 

Sees 

Soe pthread attr destroy (attre) 

// 将 pthread 信 息 保存 在 0SThread 中 
951: Gasthread Ssetlothreadmial( en 
S52 








// 等 待 子 线程 完成 初始 化 或 出 现 异常 结束 
954: { 
2 Monitor* syne with child = osthread->startThread lock(); 
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56E MutexLockerEx ml (sync with child, 
Mutex: :nolsatepormtleneckt la 
957: while ((state = osthread->get state()) == ALLOCATED) { 
958: sync with child->wait (Mutex:: no safepoint check flag); 
959 } 
960 } 
965 } 
SIS De cuene ee 
978: } 


第 935 行 代 码 调用 pthread create () 创建 线程 。 传 递 给 它 的 参数 
分 别 来 自 以 下 数据 。 


Qa 指向 接收 线程 ID 的 变量 的 指针 

@) 栈 属 性 。 通 过 指向 之 前 设置 的 attr 的 指针 来 指定 
@) 在 线程 上 进行 处 理 的 函数 地 址 

传递 给 在 @ 中 指定 的 函数 的 参数 




















第 954 行 至 第 960 行 代码 会 等 待 创建 出 的 线程 完成 初始 化 。 第 957 
行 代码 的 while 循环 会 一 直 等 待 线程 的 状态 变 为 ALLOCATED 之 外 的 值 。 
线程 的 状态 是 在 java_start () 中 被 改变 的 。 也 就 是 说 ， 当 创建 出 的 线 
程 准备 就 绕 ， 且 线程 的 处 理 实际 开始 执行 后 会 退出 while 循环 。 第 958 
行 代码 中 的 wait () 是 让 线程 等 待 的 处 理 。 我 将 在 后 面 的 章节 中 对 
wait () 进行 详细 讲解 。 





















































12.6.1 ” 栈 的 警戒 缓存 


在 os::create_thread() 中 有 设置 栈 的 警戒 缓存 大 小 的 代码 ， 如 
下 所 示 。 

















os/linux/vm/os_linux.cpp:0s::create thread() ( 再 次 贴 出 











9285 pehreadlatterisetouardelzel( 
laa OEo rab olanee ls ‘eV! (salalhe "aoe 


所 谓 栈 的 警戒 缓存 ， 是 指 为 了 防止 栈 内 存 溢 出 而 设置 的 警戒 内 存 空 








116 | 第 12 章 HotSpotVM 的 线程 管理 





间 。 如 图 12.4 所 示 ，Linux 在 紧邻 栈 内 存 的 地 方 设置 了 一 块 额外 的 内 存 
空间 ， 当 发 生 栈 溢出 时 ， 访 问 这 块 警戒 缓存 就 会 发 出 SEGV 信号 。 











可 以 用 作 栈 内 存 的 


空间 














于- 于 一 栈 底部 
操作 系统 的 警戒 缓存 








图 12.4 ”警戒 缓存 


在 可 用 于 栈 内 存 的 内 存 空间 底部 有 一 块 警戒 缓存 ， 访 问 操作 系统 的 警戒 组 
存 就 等 于 栈 内 存 溢出 了 。 








警戒 缓存 空间 的 大 小 是 通过 os : :Linux: :default guard_ size() 
指定 的 。 该 函数 的 定义 如 下 所 示 。 











oe Nn 


662: size t os::Linux::default guard size(os::ThreadType thr type) { 
665: returnel(e nt yes = vamhinead 0 Dagens ne 
666: } 














如 果 不 是 Java 线程 ， 则 返回 1 页 大 小 ; 如 果 是 Java 线程 ， 则 返回 
0。 也 就 是 说 ， 如 果 是 Java 线程 ， 就 不 创建 警戒 缓存 。 这 是 为 什么 呢 ? 

如 图 12.5 所 示 ，Java 线程 另行 准备 了 自己 的 警戒 缓存 ， 可 以 实现 关 
于 栈 洪 出 的 错误 处 理 和 事后 处 理 。 也 就 是 说 ， 在 Java 线程 中 ， 操 作 系 统 
准备 警戒 缓存 毫 无 意义 ， 反 而 浪费 缓存 空间 ， 所 以 pthreead_attr 


setguardsize () 会 将 其 指定 为 0。 
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使 用 中 | 

必用 作 栈 内 存 的 

. 

自己 的 警 藉 缓存 

J 一 栈 底部 
操作 系统 的 警戒 缓存 

( 未 分 配 ) 














隔 避 

















12.5 _ Java 线程 的 警戒 缓存 
Java 线程 在 可 以 用 作 栈 内 存 的 空间 底部 有 一 块 自己 的 警戒 缓存 。 


了 方 关 开始 Linux 线程 的 处 理 


由 于 在 Linux 中 无 法 生成 暂停 状态 的 线程 ， 所 以 java_start () 会 
立即 被 执行 。 














os/linux/vm/os_linux.cpp 
807: static void *java start (Thread *thread) { 
/* 偏 移 缓存 行 的 处 理 */ 


819: OSThread* osthread = thread->osthread(); 
820: Monitor*syne = osthread >startThread loek(), 


// 与 父 线 程 的 握手 











5475 | 
848 : MutexLockerEx ml (sync, Mutex:: no safepoint check flag); 
849 
// 唤醒 等 待 中 的 父 线程 
85: osthread->set state (INITIALIZED); 
8525 Cyne- Snoiry a 

















// 等 待 os: :start thread() 被 调 








S55S while (osthread->get state() == INITIALIZED) { 
856: sync->wait (Mutex:: no safepoint check flag) ， 
857: } 

858E } 

B62: thvead >eun( 


8625 
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863: 
864: 
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return 0; 


} 


第 848 行 至 第 852 es 线程 发 送 通知 ， 
它们 自己 的 初始 化 过 程 已 经 结束 了 。 然 后 ， 在 第 855 行 和 第 856 和 
sn 子 线程 会 等 待 os : :start thread() 被 调用 。 











父 线程 会 在 检测 到 第 851 行 代码 中 发 生 的 线程 状态 变化 后 结束 





os: :create _ thread() ， 并 调用 os::start thread()。os::start 
thread() 是 Linux 和 Windows 共通 的 函数 。 让 我 们 再 次 一 起 看 一 看 这 


个 函数 。 


share/vm/runtime/os.cpp ( 再 次 贴 出 ) 


S95 


:人 
S99 
700: 
TQ: 











山 




















void os::start thread (Threadx thread) { 


OsSThread* osthread = thread->osthread(); 
osthread->set state (RUNNABLE); 
panstartathread( hread, 


} 


第 669 行 代 码 将 线程 状态 变 为 RUNNABLE。 这 样 一 来 ， 线 程 就 会 退 
出 while 循环 。pda_start_thread() 的 处 理会 唤醒 处 于 等 待 状态 的 子 


线程 。 











STILLSCSLROUERCDR 


1047: 
1048: 


L050 
L051: 


T0525 
L053 


第 1052 行 代 码 会 唤醒 子 线程 。 子 线程 在 退出 等 待 状态 后 会 调用 


(3 


void os::pd start thread (Threadx thread) { 
OSThread * osthread = thread->osthread(); 


Menitor* syncowithlchild osthread >startThreadB lock (Ds; 
MutexLockerEx ml (sync with child, 

NE 二 noESaFeponncEcnEcs iso 及 
SyncEwEnECPlasmotnEY () 


} 




















开始 执行 用 户 定 义 的 线程 处 理 。 
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本 章 将 讲解 在 访问 线程 间 共 享 资源 时 所 进行 的 互 斥 处 理 。 由 于 在 进 


























行 GC 的 线程 间 ， 对 象 是 被 当 作 共享 资源 的 ， 所 以 在 很 多 情况 下 需要 进 
行 互 斥 处 理 。 


上 上天 大 什么 是 互 斥 处 理 


如 果 线 程 共享 内 存 空间 ， 那 么 就 会 出 现 多 个 线程 同时 在 一 个 地 址 上 
读 写 数据 的 情况 。 有 些 数据 可 能 会 因 其 他 线程 的 插入 而 更 改 ， 如 果 在 编 
程 时 没有 考虑 到 这 一 点 ， 内 存 就 会 在 意 想 不 到 的 地 方 遭 到 破坏 ， 这 会 引 
发 难以 查 清原 因 的 错误 。 

像 这 样 对 于 某 个 单一 资源 ， 多 个 线程 同时 进行 处 理会 引发 问题 的 部 
分 ， 就 称 为 “临界 区 ”( critical section )。 

在 处 理 临 界 区 时 ， 线 程 必须 进行 一 连 串 的 原子 操作 ， 以 防 其 他 线程 
的 处 理 插 进 来 。 某 个 线程 阻止 其 他 线程 插入 ， 自 己 独 享 资 源 的 处 理 就 称 
为 “ 互 斥 处 理 ”。 


实现 互 斥 处 理 的 一 种 简单 的 方式 是 使 用 互 斥 量 "”( mutex ), 这 个 词 是 
1 词组 mutal exclusion ( 互 斥 条 件 ) 合成 而 来 的 。 

关于 互 斥 量 有 很 多 种 比喻 ， 这 里 引用 武者 品 纪 在 其 著作 中 所 举 的 卫 
生 间 的 例子 ao。 






























































中 也 称 为 互 斥 锁 。 一 一 译 者 注 
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假设 多 位 家 庭 成 员 住 在 只 有 一 个 卫生 间 的 房子 里 。 使 用 卫生 间 时 需 
要 遵守 一 定 的 规则 。 当 卫生 间 的 门 上 挂 着 “使 用 中 ”的 牌子 时 不 能 使 用 
卫生 间 ， 想 使 用 卫生 间 的 人 必须 在 卫生 间 外 等 待 。 如 果 卫 生 间 的 门 上 挂 
着 “未 使 用 ”的 牌子 ， 那 么 翻转 牌子 ， 让 “使 用 中 ”的 一 面 朝 上 后 ， 就 
可 以 独自 使 用 卫生 间 了 。 使 用 完 卫 生 间 的 人 可 以 将 “使 用 中 ” 那 一 面 翻 
转 为 “未 使 用 "， 而 其 他 人 是 不 能 进行 这 个 操作 的 。 将 牌子 翻 到 “使 用 
中 ”一 面 的 操作 称 为 “加 锁 ”( lock )， 将 牌子 翻 到 “未 使 用 ”一 面 的 操 
作 称 为 “解锁 ”( unlock )， 卫 生 间 则 称 为 “临界 区 ”。 

无 论 家 庭 关 系 多 么 和 有 睦 ， 两 个 人 同时 使 用 一 个 卫生 间 的 情况 都 是 不 
存在 的 ( 吧 )。 因 此 ， 如 果 将 每 位 家 庭 成 员 看 作 线 程 ， 那 么 想必 大 家 都 
能 理解 “卫生 间 就 相当 于 临界 区 ”的 说 法 。 

在 本 例 中 ， 使 用 卫生 间 前 无 须 敲 门 ， 其 他 人 也 不 会 在 有 人 的 时 候 进 
和 卫生间。 这 就 是 “ 互 斥 量 ”。 

互 斥 量 是 互 斥 处 理 的 一 种 基本 实现 ， 基 于 互 斥 量 还 可 以 实现 其 他 许 
多 互 斥 处 理 。 


Java 语言 自 带 监视 需 ( monitor ) 这 种 同步 结构 。 而 HotSpotVM 内 
部 的 互 斥 处 理 一 般 都 会 使 用 监视 器 。 
在 讲解 监视 器 之 前 ， 我 想 提 醒 大 家 注意 一 点 : Java 中 用 到 的 监视 器 

































































































































































与 通常 大 家 熟知 的 监视 器 略 有 不 同 。 因 此 如 果 想 学 习 一 般 的 监视 器 的 知 
识 ， 建 议 大 家 读 一 读 武 者 晶 纪 的 著作 "9。 








下 面 ， 我 们 借助 滑雪 板 租赁 商店 的 情景 讲解 Java 监视 器 ( 图 13.1 )。 
假设 租赁 商店 中 滑雪 板 的 尺寸 和 样式 都 相同 ， 而 且 商 店 非常 窗 小 ， 一 次 
只 能 进入 一 位 顾客 。 如 果 前 面 已 经 有 顾客 进入 商店 ， 那 么 其 他 顾客 就 只 
能 在 店 外 排队 等 待 。 当 店内 没有 顾客 后 ， 排 在 第 一 位 的 顾客 就 可 以 进入 
店内 。 进 入 店内 的 顾客 可 以 租 滑 雪 板 。 如 果 没 有 多 余 的 滑雪 板 了 ， 那 么 
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I 




















顾客 就 要 在 店内 的 等 候 室 里 等 待 。 

返还 滑雪 板 的 顾客 同样 必须 在 店 外 排队 等 待 。 将 滑雪 板 返还 后 ， 顾 
客 可 以 呼叫 一 位 在 等 候 室 里 等 待 的 顾客 或 所 有 顾客 。 被 呼叫 的 顾客 只 有 
在 店 里 没有 其 他 顾客 的 情况 下 才 可 以 进入 店内 。 如 果 店 外 有 人 排队 ， 那 
么 他 必须 排 到 队 尾 等 待 。 如 果 再 次 进入 商店 时 滑雪 板 恰巧 又 没有 了 , 那 
么 他 还 是 必须 进入 等 候 室 等 待 。 
































租赁 处 





13.1 ”监视 器 示例 一 一 窄 小 的 滑雪 板 租赁 商店 


以 上 是 关于 监视 器 的 比喻 。 这 时 ， 共 享 资源 是 滑雪 板 ， 监 视 器 是 租 
赁 商店 。 如 果 将 顾客 看 作 线 程 ， 那 么 同时 只 能 有 一 个 线程 进入 监视 器 。 
当 租 赁 商店 中 有 顾客 时 ， 商 店 处 于 被 加 锁 的 状态 。 顾 客 离开 后 商店 被 解 
锁 ， 其 他 顾客 就 可 以 进入 商店 了 。 就 Java 语言 而 言 ， 在 等 候 室 内 等 待 就 
是 wait 方 法 ， 通知 等 修 室内 的 一 位 顾客 就 是 notify 方法 ,通知 所 有 顾客 
就 是 notifyAll 方法 。 























13.3.2 ”Java 监视 器 与 一 般 监 视 器 的 区 别 


我 们 再 来 看 一 个 例子 。 现 在 假设 共享 资源 是 租赁 的 影碟 。 如 果 没 有 
想 看 的 影碟 ， 那 么 顾客 必须 在 等 候 室 等 待 。 返 还 影碟 的 顾客 在 返还 后 会 
通知 等 候 室 里 的 顾客 。 这 时 所 返还 的 影碟 不 一 定 是 被 通知 到 的 顾客 想 要 
租 的 影碟 。 如 果 不 是 想 要 的 ,那么 这 位 顾客 必须 回 到 等 候 室 继续 等 待 。 
这 种 监视 咒 的 问题 在 于 ， 在 等 候 室 的 顾客 无 法 告知 商店 自己 想 要 租 什么 
影碟 。 如 果 顾 客 可 以 将 “我 想 看 的 影碟 是 这 个 〈 张 三 六 这 样 的 字条 贴 
在 店内 ， 那 么 返还 影碟 的 顾客 在 看 到 字条 后 就 可 以 准确 地 通知 正在 等 待 



























































122 | 第 13 章 线程 的 互 斥 处 理 





的 顾客 。 这 样 可 以 避免 被 通知 到 的 顾客 进入 店内 后 发 现 没有 自己 想 租 的 
影碟 而 失望 。 这 样 的 “字条 ”就 称 为 条 件 变 量 ( condition variable )。 

这 就 是 Java 监视 带 与 一 般 监视 带 的 不 同 之 人 处。 一般 的 监视 带 中 有 条 
件 变量 ， 而 Java 的 监视 器 中 没有 。 

如 果 监 视 咒 所 管理 的 共享 资源 是 像 影碟 这 样 非常 依赖 于 顾客 需求 的 
资源 ， 那 么 留 字条 的 方式 更 加 方便 。 因 为 返还 影碟 的 顾客 可 以 选择 等 候 
区 内 合适 的 顾客 进行 通知 ， 减 少 了 顾客 无 故 被 通知 的 情况 。 而 Java 的 监 
视 需 中 没有 字条 ， 因 此 返还 影碟 的 顾客 会 通知 等 候 室 内 的 所 有 顾客 ， 然 
后 让 他 们 自己 判断 是 否 有 可 用 的 资源 。 

不 过 ， 如 果 监 视 右 所 管理 的 共享 资源 是 前 面 滑雪 板 那 种 不 依赖 于 顾 
客 的 资源 ， 那 么 使 用 Java 的 监视 器 就 完全 没有 问题 。 由 于 所 有 滑雪 板 都 
是 一 样 的 ， 在 等 候 室 里 等 待 的 顾客 随便 借 哪 一 个 都 行 ， 只 要 有 人 返还 一 
个 滑雪 板 就 可 以 ， 因 此 他 们 无 须 留 字条 。 

Java 中 提供 的 就 是 这 种 不 带 条 件 变量 的 简单 的 监视 器 。 


下 志明 监视 器 的 实现 


这 里 我 们 看 一 下 监视 带 的 实现 方法 。 不 过 这 个 话题 有 些 偏 离 GC 的 
主题 ， 因 此 这 里 仅 粗略 地 讲解 实现 中 重要 的 部 分 。 此 外 ， 这 里 所 讲述 的 
实现 方法 是 HotSpotVM 的 例子 ， 并 非 所 有 监视 器 都 是 这 么 实现 的 。 


















































13.4.1 ”线程 的 暂停 与 重新 启动 


首先 来 看 一 看 线程 在 “排队 ”或 在 “等 候 室 ”等 待 时 的 暂停 与 重新 
启动 。 这 两 个 处 理 分 别 是 在 下 面 这 两 个 成 员 函 数 中 实现 的 。 











@ os::PlatformEvent::park(): 等 待 


® os::PlatformEvent::unpark(): 目 


如 


所 启动 











英文 单词 park 是 “停车 ”>，unpark 是 “发 车 ”的 意思 。 这 两 个 成 员 
函数 在 不 同 的 操作 系统 上 有 不 同 的 实现 。 这 次 我 们 就 简单 地 看 一 下 它们 
在 Linux 上 的 实现 。 
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park() 成 员 函 数 是 像 下 面 这 样 使 用 pthread_cond_wait () 实现 等 





待 处 理 的 。 


_cond 是 条 件 变 量 ， mutex 是 互 扩 量 ， 它 们 都 会 被 Pthreads 使 用 。 第 


os/linux/vm/os_linux.cpp 


4916: void os::PlatformEvent::park() { 





4928: metatus peneeadmueexalock (meex) 
4933: status = pthread cond wait( cond, mutex); 
4948: } 


os: :PlatformEvent 的 实例 中 有 _cond 和 mutex 两 个 成 员 变 量 。 











4928 行 代码 调用 pthread mutex _ lock () 锁定 _mutex。 然 后 ， 第 4933 


行 


代码 调用 pthread_cond_wait() 将 当前 线程 变 为 暂停 状态 。 





pthread cond _ wait () 接收 cond 和 表示 锁定 状态 的 _mutex 作为 参 


数 。 


被 解锁 。 





当 线程 变 为 暂停 状态 后 ，_mutex 在 pthread cond wait () 内 部 会 




















unpark () 会 像 下 面 这 样 调用 pthread cond signal() 重新 启动 


线程 。 


在 条 


os/linux/vm/os_linux.cpp 


5011: void os::PlatformEvent::unpark() { 


5028: metbacus = enmeadmeexmloe 人 mnES 
5034: pthreagdecond signal (econgd), 
5049: } 


第 5034 行 代码 中 的 pthread cond signal() 会 对 通过 参数 指定 
件 变 量 上 等 待 的 一 个 线程 发 送信 号 ， 重新 启动 它 。 0 
:PlatformEvent 实例 中 在 _cond 变量 上 等 待 的 线程 发 送信 号 。 
顺便 一 提 ， 在 Windows 上 是 使 用 WaitEorSsingleobject ()、 


























SetEvent () 实现 与 上 面 几乎 相同 的 处 理 的 。 











Thread 类 中 有 一 个 成 员 变 量 是 ParkEvent 类 的 实例 。 
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ParkEvent 类 继承 自 os : :PlatformEvent 类 。 
share/vm/runtime/thread.hpp 


94: class Thread: public ThreadSshadow { 

















// 被 内 部 的 Mutex/Monitor 使 
Sos ParkEvent * MutexEvent ; 








此 ， 如 图 13.2 所 示 ， 对 于 HotSpotVM 所 管理 的 一 个 线程 
(Thread 类 实例 ) 的 _MutexEvent ， 通 过 调用 park() 、unpark() 可 以 
暂停 或 是 重新 启动 目标 线程 。 在 讲解 监视 器 时 的 比喻 中 讲 到 的 “在 等 候 
室 里 等 待 ” “从 等 候 室 出 来 ” “排队 等 待 ”等 操作 都 是 通过 调用 park () 
unpark () 实现 的 。 


























unpark () 


A park () SS 


a 
> | 运行 中 | 


和 人 
13.2 park() 和 unpark() 


对 一 个 线程 调用 park () 后 该 线程 就 会 暂停 。 让 线程 处 于 暂停 状态 可 以 避 
免 浪 费 CPU 计算 。 调 用 unpark () 后 可 以 重新 启动 线程 。 








13.4.2 ”监视 器 的 加 锁 与 解锁 

下 面 我 们 来 看 一 看 监视 器 的 加 锁 与 解锁 。 由 于 接 下 来 的 实现 非常 复 

， 所 以 这 里 只 粗略 地 介绍 一 下 。 

图 13.3 是 监视 器 状态 的 一 个 例子 。 在 这 个 监视 器 中 ， 队 列 ( EntryList ) 
里 有 B、C 两 个 线程 正在 等 待 。 监 视 器 前 面 有 一 个 狭小 的 走廊 ( onDeck )。 
然后 ， 当 前 持 有 监视 器 内 的 锁 的 是 线程 A。 
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队列 ( EntryList ) 


走廊 监视 右 
(OnDeck ) 二 


- (| A 


等 候 室 
(WaitSet ) 


dg 


13.3 ”监视 器 状态 示例 
由 于 监视 器 被 加 锁 了 ， 所 以 EntryList 中 的 线程 B 无 法 获取 锁 。 








先 来 看 一 看 加 锁 的 流程 。 在 某 个 线程 获取 锁 时 ， 如 果 监 视 器 内 没有 其 
他 线程 ， 那 么 它 可 以 立即 进入 监视 器 并 获取 锁 ( 参考 图 13.3 中 的 线程 A )。 
而 如 果 这 时 监视 器 内 已 经 有 其 他 线程 了 ， 那 么 它 就 必须 排 到 EntryList 
队列 中 ， 等 待 其 他 线程 离开 监视 器 ( 参考 图 13.3 中 的 线程 B、C )。 

接 下 来 看 一 看 解锁 的 流程 。 在 监视 带 被 解锁 时 ，EntryList 中 的 线 
程 会 执行 取 锁 处 理 。 例 如 线程 A 在 解锁 时 的 具体 步骤 如 下 所 示 。 























OQ 解锁 了 监视 器 的 线程 A 将 EntryList 中 的 第 一 个 线程 (B ) 放 
到 onDeck 中 

@) 线程 A 唤醒 onDeck 的 线程 B ( unpark 

@ 线程 B 确认 自己 是 否 在 onpeck 中 

人 线程 B 进入 并 给 监视 器 加 锁 





) ) 











13.4.3 ”监视 器 的 wait、notify 和 notifyAll 方法 


首先 来 考虑 wait 方法 的 实现 。 由 于 监视 器 内 的 线程 在 wait 时 也 会 解 
锁 监 视 器 ， 所 以 wait 方 法 的 实现 与 上 一 小 节 中 解锁 监视 器 的 处 理 相同 。 不 
过 ， 在 wait 方法 中 必须 有 调用 park () 让 监视 器 内 的 线程 等 待 的 处 理 。 

接 下 来 考虑 notifyAl 方法 的 实现 。 图 13.4 是 多 个 线程 在 等 候 室 
(WaitSet ) 中 等 待 的 示意 图 。 此 外 ，EntryList 中 没有 线程 排队 ， 获 
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取 监 视 带 锁 的 是 线程 A。 


队列 ( EntryList ) 


走廊 监视 器 
| ( OnDeck ) i 


A 


等 候 室 
(WaitSet ) 


图 13.4 线程 的 notifyAll 


线程 B、C 在 WaitSet 中 处 于 调用 park() 之 后 的 状态 。 线 程 A 拿 着 监视 
器 的 锁 。EntryList 是 空 的 。 














假设 此 时 线程 A 在 监视 器 内 执行 了 notifyAll 处 理 。 

notifyAll 会 从 Waitset 内 取出 线程 ， 并 对 其 调用 unpark () 。 这 些 
线程 从 Waitset 中 出 来 后 ， 几 乎 同时 开始 运行 。 然 后 ， 如 图 13.5 所 示 ， 
它们 会 一 边 竞争 一 边 形成 一 个 队列 。 这 条 队列 称 为 ContentionQueue。 
在 队列 形成 后 ， 线 程 A 会 亲自 调用 park () ， 进 入 暂停 状态 。 


监视 器 
Wa Ci EE 
ContentionQueue 
司 Na 
\| WaitSet ) 


13.5 ”线程 竞 


从 WaitSet 中 出 来 的 线程 B、C 一 边 竞争 一 边 形成 一 个 队列 。 这 时 它们 在 
队列 中 的 顺序 取决 于 竞争 结果 ， 赢 的 排 在 前 面 。 














队列 (EntryList ) 
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最 后 , 线程 A 解锁 监视 器 ( 图 13.6 )。 这 时 线程 A 会 尝试 将 EntryList 
中 的 第 1 个 线程 放 到 onpeck 中 ,但 是 EntryList 是 空 的 ， 因 此 线程 A 
会 将 contentionQueue 升级 为 BntryList。 然 后 ， 它 再 将 EntryList 
中 的 第 1 个 线程 放 到 onDeck 中 ， 并 对 其 调用 unpark () 。 这 之 后 的 处 理 
与 前 面 讲解 过 的 解锁 处 理 相 同 ， 因 此 不 再 歼 述 


























队列 (EntryList ) 


OOD 


ContentionQueue 


SN | [ "a 
i t) | | Ss 


(WaitSe 


图 13.6 监视 器 的 解锁 


解锁 监视 器 的 线程 A 将 ContentionQueue 升级 为 BntryList， 并 将 第 1 
个 线程 放 到 OnDeck 中 。 





最 后 是 notify 的 实现 。 除 了 是 通知 Waitset 中 的 所 有 线程 还 是 通知 
的 一 个 线程 这 一 点 ， 它 的 处 理 流程 与 notifyAll 的 相同 。 


HotSpotVM 中 实现 了 一 个 Monitor 类。 在 VM 内 部 使 用 的 线程 会 
使 用 这 个 类 进行 互 斥 处 理 。 
Monitor 类 中 定义 有 如 下 所 示 的 成 员 函 数 。 




















i 
4 




















share/vm/runtime/mutex.hpp 
87: class Monitor : public CHeapobj { 


lol 


185: boolwait(booWnorsafepoint eheck = /neonsafepoint check flagy 
186: tengo eimneouee = 
Teys bool as_ suspend equivalent 


= | as suspend equivalent flag),; 
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Teer oolnocse yo 
ao een mee ell 


3 void lock (Thread *thread); 
194: void unlock(); 














这 个 Monitor 类 的 一 个 实例 就 相当 于 前 面 租赁 商店 的 例子 中 的 监视 
器 。 例 如 ， 创 建 了 10 个 Monitor 类 的 实例 ， 就 相当 于 创建 了 10 家 租赁 
商店 的 监视 器 。 然 后 ， 各 家 租赁 商店 分 别管 理 各 自 的 共享 资源 。 而 顾客 
(线程 ) 只 要 遵守 监视 器 的 规定 ， 就 可 以 进入 所 有 的 租赁 商店 。 

不 看 具体 的 代码 可 能 很 难 想象 这 是 一 种 什么 样 的 场景 ， 所 以 接 下 来 
我 们 看 一 看 Monitor 类 的 示例 代码 。 





























: // 监视 器 通过 new Monitor (Mutex: :safepoint, “Test Monitor”) ;被 初始 化 
Mondtor* shopamondtory 

// 用 来 表示 租赁 商店 的 全 局 变量 

Rentalsneop rencals no 
































: class Client { 
Board* _snowboard; 


Lp 


FADovn 贡 路 轴 担 靖 


0 


第 2 行 代码 定义 了 一 个 全 局 变量 shop_monitor， 它 保存 了 指向 
Monitor 实例 的 指针 。 第 4 行 代码 定义 了 一 个 表示 租赁 商店 的 全 局 变量 
rental_shop。 假 设 这 些 变量 会 在 其 他 地 方 被 其 他 函数 初始 化 。 

6 行 代码 定义 了 client 类 。client 类 表示 访问 租赁 商店 的 顾 
客 ，shop_monitot 表示 租赁 商店 的 监视 占 。c1lient 中 有 成 员 变 量 
_snowboard， 里 面 存放 着 被 借 走 的 滑雪 板 。 
接 下 来 定义 client 类 中 表示 租赁 滑雪 板 的 成 员 函 数 rent () 。 


















































1 void rent() { 

2 // 加 锁 

3 shopamonitor lock, 

4: // 一 直 等 到 有 滑雪 板 可 租赁 

55 while (rental _ shop.snowboards .empty()) { 
6 Shop _ monitor .wait () ; 

} 

8 // 租赁 滑雪 板 
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9: _snowboard = rental shop.snowboards.pop(); 
au shop monitor Unlock() 
lia 


第 3 行 代码 调用 shop_monitor.1lock() 获取 监视 器 的 锁 。 如 果 监 
视 器 已 经 被 加 锁 了 ， 那 么 就 要 等 待 ， 直 到 可 以 获取 监视 器 锁 。 第 5 行 和 
第 6 行 是 在 没有 可 用 的 滑雪 板 时 解锁 监视 器 并 一 直 等 待 的 代码 。 如 果 有 
别 的 顾客 通知 这 个 顾客 ， 那 么 第 9 行 代码 会 取出 滑雪 板 ， 将 其 保存 在 
_snowboard 中 。 接 着 ， 第 10 行 代码 会 解锁 监视 髓 。 

接 下 来 定义 表示 返还 滑雪 板 的 成 员 函 数 return () 。 
































void return() { 
shop monitor.1ock (); 
// 返还 滑雪 板 
rental shop.snowboards.push!( snowboard); 
snowboard = NULL; 


// 仅 通知 一 位 正在 等 待 的 顾客 
shoplmeonator no 
shop monitor.unlock(); 


} 
这 里 与 rent () 一 样 ， 要 先 获取 锁 再 返还 滑雪 板 。 然 后 ， 第 7 行 代 
码 会 通知 一 位 正在 等 待 的 顾客 ， 第 8 行 代码 会 解锁 监视 带 。 被 通知 的 顾 
客 (在 rent() 中 等 待 的 顾客 ) 会 锁定 监视 器 并 借 走 滑雪 板 。 


HotSpotVM 中 也 实现 了 表示 互 斥 量 的 Mutex 类 。Mutex 类 继承 自 
Monitor 类 ， 可 以 几乎 原封 不 动 地 使 用 Monitor 类 中 的 功能 。 








\D ov~ am 中 ww 睛 














share/vm/runtime/mutex.hpp 


262: class Mutex : public Monitor { 
2 Jololaep 


264: Mutex (int rank, const char *name, bool allow vm block=false); 
2 ~Mutex () ; 

266r Divatel: 

2 boonmoer rey { ShouldNotReachHere(); return false; } 
268: bool notify all() { ShouldNotReachHere(); return false; } 


269: bool wait (bool no safepoint check, 
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long timeout, 
bool as suspend equivalent) { 


Dos ShouldNotReachHere() ; 
B71: eeu talsen, 

2 } 

aos bs 


互 斥 量 只 要 有 加 锁 和 解锁 就 足够 了 ， 因 此 第 267 行 至 第 272 行 代码 
将 notify() 、notify all() 和 wait() 重新 定义 为 无 法 被 调用 的 状态 了 。 


下 直面 MutexLocker 类 


MutexLocker 是 一 个 有 助 于 明确 地 定义 加 锁 范 围 的 类 。 



































share/vm/runtime/mutexLocker .hpp 


156: class MutexLocker: Stackobj { 
se vale 


下 5 MGUTECT me 
让 oo es 

160: MutexLocker (Monitor * mutex) { 
TGS _mutex = mutex; 
164: motexw > loc 
USE | 

175: ~MutexLocker() { 
6 mauex Sunloce 
Th 

de 

Tg 本 


这 个 类 所 进行 的 处 理 就 是 在 构造 函数 内 锁定 成 员 变 量 _mutex, 在 
析 构 函数 内 解锁 _mutex， 仅 此 而 已 。 

这 个 类 的 定义 本 吴 非 常 简单 ， 如 果 使 用 该 类 ， 那 么 13.5 节 中 介绍 的 
rent () 困 数 就 可 以 像 下 面 这 样 改 写 。 














开 void zent() { 

2 { 

3 MonitorLocker locker (Shop monitor); 

4: while (rental shop.snowboards.empty()) { 
5 shop monitor.wait (); 

6 

eh 


} 


_snowboard = rental shop.snowboards.pop(); 
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8: } 
98 

在 通过 第 3 行 代 码 创建 MonitorLocker 类 的 实例 时 ， 该 类 的 构造 
函数 会 锁定 shop_monitor。 由 于 执行 到 第 8 行 代码 时 ， 在 栈 内 分 配 的 
MonitorLocker 类 的 实例 会 被 释放 ， 所 以 该 类 的 析 构 函数 被 调用 ， 进 而 
会 解锁 shop_monitor。 

如 上 所 示 ， 使 用 MutexLocker 类 后 ,需要 进行 锁定 处 理 的 范围 就 会 
更 加 明确 。 此 外 ，MutexLocker 类 还 能 避免 离开 作用 域 时 (发生 异常 时 等 ) 
忘记 解锁 监视 器 等 常见 错误 。 因 此 HotSpotVM 内 的 代码 中 很 多 地 方 用 
到 了 MutexLocker 类 和 加 上 了 Nul1 检查 的 MutexLockerEx 类 。 


生生 


动画 角色 的 GC 分 类 





























~ 
SS 


保守 式 GC!! 
NM NNN 




















中 出 自动 画 《 天 空 之 城 》 称 斯 卡 的 台词 。 一 一 译 者 注 
@ 出 自动 画 《北斗 神 拳 》 主人 公 健 次 郎 的 台词 。 一 一 译 者 注 























本 章 将 讲解 使 用 多 个 在 HotSpotVM 中 实现 的 线程 并 行 地 执行 任务 




















的 框架 ,看 一 看 并 行 GC 是 如 何 使 用 该 框架 的 。 


下 忆 天 | 并 行 执行 的 流程 


HotSpotVM 中 实现 了 能 够 以 多 个 线程 并 行 执行 某 项 任务 的 机 制 。 这 
种 机 制 主要 由 以 下 角色 来 完成 。 








e@ AbstractWorkGang: 工人 集合 
@ AbstractGangTask: 让 工人 执行 的 任务 
e GangWorker: 执行 指定 任务 的 工人 





下 面 ， 我 们 来 看 一 看 这 些 角色 并 行 地 执行 任务 的 流程 。 

首先 ， 如 图 14.1 所 示 ，AbstractWorkGang 只 有 一 个 监视 项 ， 它 
会 让 属于 AbstractNWorkGang 的 GangWorker 在 监视 器 的 等 候 室 中 
等 待 。 
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AbstractWorkGang AbstractGangTask 





任务 的 地 址 : NULL 
任务 的 编号 : 0 

执行 任务 的 工人 总 数 : ? 
完成 任务 的 工人 总 数 : ? 













图 14.1 步骤 中 


AbstractWorkGang 只 有 一 个 监视 器 ， 它 会 让 GangWorker 在 等 候 室 中 等 待 。 





由 监视 器 负责 进行 互 斥 处 理 的 共享 资源 是 任务 信息 的 布告 板 。 布 告 
板 上 有 以 下 信息 。 


e 任务 的 地 址 
e 任务 的 编号 
e 执行 任务 的 工人 总 数 
e 完成 任务 的 工人 总 数 


接 下 来 ,客户 会 在 布告 板 上 写 下 希望 并 发 执行 的 任务 的 信息 (图 142 )。 





AbstractWorkGang AbstractGangTask 


任务 的 地 址 : x x x x 
任务 的 编号 : 1 





执行 任务 的 工人 总 数 : 0 





14.2 步骤 @@ 
客户 获取 监视 器 的 锁 并 在 布告 板 上 写 下 任务 信息 。 
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客户 带 来 的 实际 任务 可 以 是 继承 自 AbstractGangTask 类 的 任何 实 
例 。 客 户 会 在 布告 板 上 写 下 该 实例 的 地 址 作为 任务 的 地 址 ， 而 任务 的 编 
号 则 是 上 一 次 任务 的 编号 加 1。 在 本 例 中 ， 这 个 值 是 1。 执 行 任务 的 工 
人 总 数 与 完成 任务 的 工人 总 数 分 别 被 初始 化 为 0。 

接 下 来 ， 客 户 会 通知 所 有 正在 等 待 的 工人 ， 然 后 自己 进入 等 候 室 
(图 14.3 )。 








AbstractWorkGang AbstractGangTask 





监视 器 













任务 的 地 址 : x x x x 
任务 的 编号 : 1 

执行 任务 的 工人 总 数 : 1 
完成 任务 的 工人 总 数 : 0 



















国 目 





图 14.3 步骤 @ 
工人 们 一 个 接 一 个 地 进入 监视 器 ， 将 布告 板 上 的 信息 记 在 自己 的 笔记 本 


上 ， 然 后 离开 监视 器 。 











被 通知 到 的 工人 们 一 个 接 一 个 地 进入 监视 器 ， 确 认 布 告 板 上 的 信 
息 。 工 人 会 记录 自己 上 次 执行 过 的 任务 编号 ， 如 果 布 告 板 上 的 编号 与 记 
录 的 编号 相同 ， 那 么 为 了 避免 重复 执行 任务 ， 他 们 会 忽略 这 个 任务 并 进 
入 等 候 室 等 待 。 如 果 是 新 的 任务 编号 ， 那 么 他 们 会 在 笔记 本 上 记录 下 布 
告 板 上 的 信息 〈 任 务 的 地 址 和 编号 )， 并 将 布告 板 上 执行 任务 的 工人 总 
数 加 1， 然后 离开 监视 器 去 执行 任务 。 

执行 完 任 务 后 ， 工 人 会 再 次 进入 监视 器 。 这 时 ， 为 了 告诉 大 家 自己 完 
成 了 一 项 任务 ， 他 会 将 布告 板 上 “完成 任务 的 工人 总 数 ” 加 1 (图 14.4)。 
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AbstractWorkGang AbstractGangTask 


任务 的 地 址 : x x x x 
任务 的 编号 : 1 


执行 任务 的 工人 总 数 : 2 
完成 任务 的 工人 总 数 : 1 





图 14.4 步骤 @ 


在 任务 完成 后 ， 工 人 再 次 进入 监视 器 ， 更 新 布告 板 上 的 信息 并 进入 等 候 室 
等 待 。 


接着 ， 这 个 工人 会 将 等 候 室 中 的 所 有 人 【包括 客户 ) 都 叫 出 来 ， 然 
后 自己 进入 等 候 室 。 所 有 工人 的 任务 都 执行 完成 后 ， 执 行 任务 的 工人 总 
数 应 当 与 完成 任务 的 工人 总 数 相 同 。 

客户 进入 监视 器 后 会 确认 布告 板 上 的 信息 ， 看 看 是 否 所 有 的 任务 都 
完成 了 (图 14.5 )。 


AbstractWorkGang AbstractGangTask 





任务 的 地 址 : x x x x 
任务 的 编号 : 1 

执行 任务 的 工人 总 数 : 2 
完成 任务 的 工人 总 数 : 2 











图 14.5 步骤 @) 
客户 进入 监视 器 ， 在 看 到 所 有 工人 都 执行 完 任务 后 退出 监视 器 。 


如 果 还 有 尚未 完成 的 任务 ， 那 么 客户 就 会 在 等 候 室 里 等 待 工人 完成 
任务 。 所 有 任务 都 完成 之 后 ， 客 户 才 会 满意 地 离开 监视 央 。 
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以 上 就 是 并 行 执行 的 流程 。 


AbstractWorkGang 类 


接 下 来 我 们 详细 地 讲解 一 下 并 行 执行 流程 中 的 出 场 角色 。 
AbstractWorkGang 类 的 继承 关系 如 图 14.6 所 示 。 





t 








AbstractWorkGang 
A 










WorkGang 
人 


FlexibleWorkGang 


14.6 ”AbstractWorkGang 类 的 继承 关系 








AbstractWorkGang 类 中 定义 了 WorkGang 所 需 的 接口 。 
share/vm/utilities/workgroup.hpp 
119: class AbstractWorkGang: public CHeapobj { 
To Virtual void run task(AbstractGangTask* task) = 0; 
139: ”// 保护 后 来 定义 的 数据 
140: ”// 或 是 通知 变化 的 监视 器 


141: Menitoremonit or 











146: ”// 属于 这 个 团体 的 工人 的 数组 

148: GangWorker** gang workers; 
149: ”// 分 配给 这 个 团体 的 任务 
工 50:: AbstractGangTask* task; 


















































151: ”// 当前 任务 的 编号 

5 2 ne Uencemnumnoer 
153: ”// 执行 任务 的 工人 总 
154: Tint started WOrkers, 
155: ”// 完成 任务 的 工人 总 老 
5 TFTTDSTEOEWOFKEeTS 


第 127 行 代码 定义 的 虚 函 数 run_task() 负责 将 任务 交 给 worker 
并 让 它们 执行 任务 。run_ task() 的 实体 是 在 子 类 WorkGang 类 中 
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定义 的 。 

第 139 行 至 第 156 行 代码 定义 了 WorkGang 所 需 的 属性 。 这 部 分 相 
当 于 14.1 节 中 讲 过 的 “任务 信息 的 布告 板 ” 中 的 数据 。 

图 14.6 中 展示 的 FlexibleWorkGang 类 能 够 在 之 后 灵活 ( flexible ) 
地 改变 可 以 执行 任务 的 工人 数量 。 并 行 GC 会 经 常用 到 这 个 类 。 


开放 AbstractGangTask 类 


AbstractGangTask 类 的 继承 关系 如 图 14.7 所 示 。 


AbstractGangTask 
GlParCleanupCTTask GlParFinalCountTask GlParTask 


14.7 ”AbstractGangTask 类 的 继承 关系 
























AbstractGangTask 类 定义 了 并 行 执行 任务 所 需 的 接 


加 | 


share/vm/utilities/workgroup.hpp 


64: class AbstractGangTask VALUE OBJ CLASS SPEC { 
eb ublics 


6 vintual vel wor (nt = 0 











其 中 最 重要 的 成 员 函 数 就 是 第 68 行 代码 所 定义 的 work () 。work () 
是 负责 执行 任务 的 函数 ， 它 接收 工人 的 编号 作为 参数 。 

任务 的 详细 处 理 是 在 G1ParTask 等 子 类 的 work () 方法 中 定义 的 。 
客户 将 AbstractGangTask 的 子 类 的 实例 传递 给 AbstractWorkGang， 
然后 让 他 们 并 行 执行 任务 。 


让 于 GangWorker 类 


GangWorker 类 是 负责 实际 执行 任务 的 类 ， 它 的 一 个 祖先 类 是 
Thread 类 (图 14.8)。 














138 | 第 14 章 GC 线程 (并 行 篇 ) 


















人 
八 
八 


14.8 GangWorker 类 的 继承 关系 


由 于 一 个 GangWoker 的 实例 对 应 一 个 线程 ， 所 以 GangWoker 也 被 


称 为 工人 线程 。 





share/vm/utilities/workgroup.hpp 


264: class GangWorker: public WorkerThread { 


278 AbstractWorkGang* gang; 


GangWorker 类 中 定义 有 一 个 成 员 变 量 _gang， 其 中 存放 着 自身 所 忆 





eal 





的 AbstractWorkGang。 


记 引 放 并 行 GC 的 执行 示例 


下 面 ， 我 们 来 一 边 阅读 实际 代码 一 边 回 顾 14.1 节 中 的 内 容 。 














代码 清单 14.1 


代码 清单 14.1 并 行 




















展示 了 作为 客户 的 主线 程 执行 并 行 GC 的 示例 代码 。 
GC 的 示例 代码 


: workers = new FlexibleWorkGang ("Parallel GC Threads", 8, true, false); 
是 wenkersEennnenalmzegwerkes 区 


: CMConcurrentMarkingTask marking task (cm, cmt); 











Tx 准备 下 人 x/ 

2 

3 

4: 

5: /* (@ 创建 任务 */ 

6 

和 

8: /* (3) 并 行 执行 任务 */ 
9 


: Workers->run task(&marking task); 


14.5 “并 行 GC 的 执行 示例 





14.5.1 4) 准备 工人 
































的 实例 ， 使 之 变 为 前 面 出 现 过 的 图 14.1 的 状态 。 





创建 和 初始 化 FlexibleWorkGang 的 时 序 图 如 图 14.9 所 示 。 





client FlexibleWorkGang GangWorker 
new FlexibleWorkGang () 








创建 中 视 医 等 
FlexibleWorkGang 的 实例 














initialize workers() 





La 
re ()*n 


new GangWorker ()*n 





vs:rcreate thread{)*n 
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先 , 通过 代码 清单 14.1 的 中 所 示 部 分 创建 和 初始 化 FlexibleWorkGang 





图 





os::start thread()*n 





os 

| 
创建 线程 

pp” 





图 


在 各 个 线程 上 执行 run () ， 
通过 调用 wait () 让 各 个 线 





准备 完成 





























14.9 创建 和 初始 化 WorkGang 的 时 序 图 








让 我 们 从 上 往 下 看 一 看 这 个 流程 。 首 先是 AbstractWorkGang 的 构 


造 函 数 。 
share/vm/utilities/workgroup.cpp 


33: AbstractWorkGang::AbstractWorkGang( 
const char* name, 


34: boo areaecneask thea 

25 beeomarelConeurent ee neas) 

36:  _name (name), 

Boeade autack ta 

38:  _are ConcurrentGC threads (are ConcurrentGC threads) { 


_monitor = new Monitor (Mutex::1leaf, 
"WorkGroup monitor", 
areneC taskithreade)y 


48; terminate = false; 
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49: task = NULL; 

50E sequence number = 0D7 
Ss _Sstarted workers = 0; 
S26 neneadwerkerse 0 
535 


Hh 


上 面 是 初始 化 监视 器 和 数据 的 代码 ， 大 家 只 看 懂 这 一 点 即 可 。 其 他 
代码 没有 太 多 关系 ， 可 以 忽略 。 

在 创建 出 AbstractWorkGang 类 的 实例 后 ， 要 通过 成 员 函 数 
initialize workers() 初始 化 工人 。 




















share/vm/utilities/workgroup.cpp 


74: bool WorkGang::initialize workers() { 


81:  _gang workers = NEW C HEAP ARRAY (GangWorker*, total workers()); 
92: for (int worker = 0; worker < total workers(); worker += 1) { 
93;: GangWorker* new worker = allocate worker (worker); 

SB _gang workers [worker] = new worker; 

96: if (new worker == NULL || !os::create thread( 


new worker, worker type)) { 


/* 省 略 : 错误 处 理 */ 


DB Ta eau 

9 } 

LO: os::start thread (new worker); 
LOS } 

104: eile ealble 

i105 } 


第 81 行 代码 用 来 按照 客户 希望 的 工人 数量 创建 一 个 工人 数组 ， 第 
92 行 至 第 103 行 代码 则 用 来 创建 工人 。 

第 93 行 代码 是 调用 allocate_worker () 创建 GangWorker， 而 第 
96 行 代码 和 第 101 行 代码 分 别 是 创建 工人 线程 和 让 工人 线程 开始 执行 处 理 。 

第 93 行 代码 中 的 allocate_worker() 的 源码 如 下 。 














share/vm/utilities/workgroup.cpp 


64: GangWorker* WorkGang::allocate worker(int which) { 

65: GangWorker* new worker = new GangWorker (this, which); 
66: Eevee wworken, 

Gs 
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allocate_ worker () 函数 以 this ( 自己 所 属 的 AbstractWorkerGang ) 
和 工人 的 编号 为 参数 创建 GangWorker 的 实例 。 

initialize_workers() 是 通过 内 部 调用 os : : start_thread() 
来 让 线程 开始 执行 处 理 。 由 于 GangWorker 继承 自 Thread 类， 所 以 
os :: start_thread() 实际 上 会 调用 让 线程 开始 执行 处 理 的 *un () 函 
数 。 让 我 们 看 一 看 GangWorker 类 的 run() 函数 。 
































share/vm/utilities/workgroup.cpp 
222: void GangWorker::run() { 


224: Log 
225， } 





run() 函数 调用 了 loop () 函数 。 这 里 我 们 只 看 loop () 函数 中 进入 
监视 器 等 候 室 等 待 的 部 分 。 
share/vm/utilities/workgroup.cpp 


241: void GangWorker::loop() { 


243: Monitor* gang monitor = gang()->monitor(); 
DA { 
249: MutexLocker ml (gang monitor); 
268: Eorm0 (brea or netvrne/ | 
/* 





* 省 略 : 检查 是 否 有 任务 























如 果 有 ， 则 通过 break 语 句 退 出 循环 
A 
283: // 解锁 ， 进入 等 候 室 等 待 
284: gang monitor->wait (/* no safepoint check */ true); 











/* 省 略 : 离开 等 候 室 后 的 处 理 */ 








oa 


首先 在 第 243 行 获 取 自 己 所 属 的 AbstractWorkGang 的 监视 器 。 在 
第 249 行 给 监视 器 加 锁 并 进入 监视 器 。 然 后 ， 在 第 268 行 中 的 循环 开始 
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处 检查 是 否 有 任务 。 由 于 线程 启动 时 多 数 情 况 下 是 没有 任务 的 ， 所 以 这 
时 基本 上 都 会 执行 第 284 行 代 码 调用 wait () 。 





14.5.2 ”GO) 创 建 任务 


准备 好 工人 后 ， 接 下 来 要 创建 让 工人 执行 的 任务 。 请 参考 代码 清单 
14.1 中 @ 的 部 分 。 这 里 以 继承 自 AbstractGangTask 的 G1GC 标记 任务 
CMConcurrentMarkingTask 为 例 进行 讲解 。 














share/vm/gc implementation/gl/concurrentMark .cpp 


1089: class CMConcurrentMarkingTask: public AbstractGangTask { 
ODIO: rae 
T0911: ConcurrentMark* Crs 


1092: GonceurnentMarkerhnead ene, 


094 UDC 
1095: voiqd work (int worker i) { 


/* 省 略 : 标记 处 理 */ 


T1598 

15: CMConcurrentMarkingTask (ConcurrentMark* cm, 

L156 ConcurrentMarkThread* emt): 

ES AbstractGangTask ("Concurrent Mark"), cm(cm), cmt (cmt) { } 


在 第 1155 行 至 第 1157 行 定义 的 CMConcurrentMarkingTask 的 构 
造 函数 接收 用 来 执行 work () 的 变量 作为 参数 。 由 于 work () 的 参数 是 
定 的 ， 所 以 任务 类 的 实例 必须 将 执行 各 个 任务 时 所 需 的 信息 作为 成 员 
变量 保存 起 来 。 
第 1095 行 至 第 1153 行 代码 是 cCMConcurrentMarkingTask 要 执行 
的 任务 的 内 容 。 创 建 出 的 各 个 GangWorker 会 调用 这 个 work () 方法 。 

















ed 














六 


























14.5.3 ”(3) 并 行 执行 任务 
最 后 是 将 任务 交 给 工人 。 
代码 清单 14.1 中 全 的 部 分 会 调用 FlexibleNorkGang 的 run 
task () 。 
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share/vm/utilities/workgroup.cpp:run task() 的 前 半 部 分 


129: void WorkGang::run task(AbstractGangTask* task) { 

132: MutexLockerEx ml (monitor(), Mutex:: no safepoint check flag); 
ESIEREaSR 

了 < 局 sequeneemnmumerr 三 | 下 

lB _Sstarted workers = 0; 

142; finished workers = 0; 





以 任务 为 参数 的 run_task () 首先 会 通过 第 132 行 代 码 获取 监视 器 
的 锁 。 然 后 ， 在 第 139 行 写 好 任务 信息 ， 在 第 140 行 至 第 142 行 更 新 其 
他 信息 。 这 一 部 分 与 图 14.2 相对 应 。 








share/vm/utilities/workgroup.cpp:run task() 的 后 半 部 分 

















144 monitor() SnoGiEy al) 
146: while (finished workers() < total workers()) { 
152: monitor()->wait (/* no safepoint check */ true); 
3 a = NULL; 
0 
然后 ， 在 第 144 行 通知 在 等 候 室 中 等 待 的 工人 。 第 146 行 至 第 153 
行 的 while 循环 的 退出 条 件 是 “所 有 的 工人 都 完成 任务 ”。 如 果 不 满足 











条 件 ， 那 么 在 第 152 行 的 客户 会 继续 等 待 。 这 一 部 分 与 图 14.5 相对 应 。 
各 个 工人 在 GangWorker 的 loop () 函数 中 调用 wait () ， 等 待 被 给 
予 可 以 执行 的 任务 。 下 面 我 们 稍微 详细 地 看 一 看 loop () 。 




















share/vm/utilities/workgroup.cpp:1loop() 的 前 半 部 分 


241: void GangWorker::loop() { 





242: int previous sequence number = 0; 

243: Monitor* gang monitor = gang()->monitor(); 
244: ”for ( ; /* 执行 任务 的 循环 */; ) { 

245: WorkData data; 

246: ie a 

247: { 


249: MutexLocker ml (gang monitor); 
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268: for ( ; /* 获取 任务 的 循环 */; ) { 

NB if ((data.task() != NULL) && 

2 (data.sequence number() != previous sequence number)) { 
oa gangW -mmternallnoLes orarn 

D9 gangamnonmt or Smolyan 

280: parte= "gangl -startedmworkerns nn 

ol: break; 

IE } 

284: gang monitor->wait (/* no safepoint check */ true); 
2 gang()->internal worker poll (&data); 

S00 } 

S02 } 

308: data.task()->work (part); 


顾名思义 ,第 242 行 的 previous sequence _number 是 用 来 记录 
上 一 个 任务 编号 的 局 部 变量 。 

从 第 244 行 开始 的 for 循环 每 循环 一 次 ， 工 人 就 会 执行 一 个 任务 。 
第 245 行 代码 中 的 WorkData 是 记录 WorkerGang 中 任务 信息 ( 布告 板 
信息 ) 的 局 部 变量 。 此 外 ， 第 246 行 代码 中 的 part 是 记录 工人 顺序 的 
局 部 变量 。 这 些 局 部 变量 都 是 在 执行 任务 的 循环 的 作用 域 (scope ) 中 定 
义 的， 因此 执行 任务 的 循环 每 循环 一 次 ， 它 们 就 会 被 清空 一 次 。 

从 第 268 行 开始 的 for 循环 是 从 WorkerGang 获取 任务 的 循环 。 通 
常 工 人 是 在 第 284 行 处 于 等 待 状态 ， 直 到 接收 到 notify_all() 的 通知 
才 会 开始 工作 。 工 人 开始 工作 后 ， 第 285 行 代码 中 的 internal 
wotrkez_pol1() 会 将 任务 信息 复制 到 局 部 变量 中 。 在 获取 了 这 些 信 息 
后 ， 第 276 行 和 第 277 行 的 条 件 分 支 代码 会 检查 当前 是 否 有 应 该 执行 的 
任务 。 如 果 有 ， 则 在 第 278 行 将 自己 已 经 启动 的 信息 记录 到 
GangWorker 中 ， 然 后 在 第 279 行 调用 notify all()， 将 工人 的 顺序 
保存 在 part 中 并 退出 循环 。 请 注意 ， 这 里 在 退出 循环 的 同时 还 解除 了 
监视 融 的 锁 。 

然后 ， 第 308 行 以 part 为 参数 调用 了 任务 的 work () 函数 。 这 里 
会 实际 地 执行 任务 。 
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到 目前 为 止 的 这 一 部 分 与 图 14.3 相对 应 。 








share/vm/utilities/workgroup.cpp:1loop() 的 后 半 部 分 











S09 { 

314: // 加 锁 

SS MutexLocker ml (gang monitor); 

6; gang( -meternalnotes Ein 

BE // 告知 任务 已 经 完成 

BallaE gang monitor->notify all(); 

S20 } 

3235 previous sequence number = data.sequence number(); 
322:  } 

局 二 } 


任务 完成 后 ， 工 人 会 再 次 获取 锁 ， 并 将 任务 完成 的 信息 写 人 到 
GangWorker 中 。 接 下 来 ， 工 人 会 调用 notify_all ()， 将 完成 的 任务 
的 编号 复制 到 previous_sequence _number 中 ， 然 后 返回 到 for 循环 
的 开始 处 。 这 一 部 分 与 图 14.4 相对 应 。 

到 此 ， 工 人 就 完成 了 一 个 任务 。 当 所 有 的 工人 都 执行 完 任 务 后 ， 客 
户 会 检查 GangWorker 中 的 信息 ， 确 认 所 有 任务 全 部 完成 。 这 样 run _ 
task () 图 数 的 执行 也 就 结束 了 。 
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本 章 将 简要 地 讲解 并 发 GC 中 用 到 的 线程 ， 与 大 家 一 起 来 看 一 看 
HotSpotVM 是 如 何 控制 线程 ， 与 mutator 并 发 执行 GC 的 。 


1 ConcurrentGCThread 类 


并 发 GC 是 用 继承 自 ConcurrentGcThread 类 的 子 类 实现 的 。 
ConcurrentGCThread 类 的 继承 关系 如 图 15.1 所 示 。 


八 
人 
ConcurrentGCThread 
人 


















ConcurrentGlRefineThread ConcurrentMarkThread "rs 


图 15.1 ConcurrentGCThread 类 的 继承 关系 





由 于 并 发 GC 是 指 与 mutator 在 不 同 线程 中 进行 GC， 所 以 
ConcurrentGCThread 类 继承 自 Thread 类 是 理所当然 的 。 

ConcurrentGCThread 中 定义 的 create and start () 成 员 函 数 会 
同时 进行 线程 的 创建 和 启动 。 由 于 所 有 继承 自 ConcurrentGCThread 类 
的 子 类 都 会 像 下 面 这 样 在 构造 聘 数 中 调用 create_and_start() ， 所 以 
每 次 它们 的 实例 被 创建 出 来 时 GC 线程 都 会 启动 。 
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share/vm/gc_ implementation/gl/concurrentMarkThread.cpp 


41: ConcurrentMarkThread: :ConcurrentMarkThread (ConcurrentMark* cm) 


425 Coneurrenteernhrea 
aE emer 

44:  _started(false), 

45:  _in progress (false), 
46:  _vtime accum(0.0), 

45 vmednmavk accum(0n0) 
48: _vtime count accum(0.0) 
49: { 

SI0E cueatceancds tearmel 

Sl 





此 外 ， 各 个 子 类 中 都 实现 了 run () 方法 ， 其 中 定义 了 线程 所 要 进行 


PSuspendibleThreadSet 类 


并 发 GC 线程 群 通 过 suspendibleThreadSet 类 来 控制 暂停 和 启 
动 。 顾 名 思 义 ，SuspendibleThreadSet 类 管理 的 是 “能 够 暂停 的 线程 
的 集合 ”。 

ConcurrentGCThread 类 中 有 一 个 静态 成 员 变 量 ， 
SuspendibleThreadSet 的 实例 。 























中 存放 的 是 











YX 


share/vm/gc implementation/shared/concurrentGCThread.hpp 


78: class ConcurrentGCThread: public NamedThread { 























// 所 有 的 实例 共用 这 个 静态 成 员 变量 
lO static SuspendibleThreadset sts; 








第 101 行 代码 中 定义 的 _sts 是 继承 自 ConcurrentGCThread 类 的 
所 有 类 的 实例 所 共用 的 静态 成 员 变 量 。 





15.2.1 集合 的 操作 | 
要 想 了 解 suspendibleThreadSet 类 ， 需要 先 了 解 它 里 面 主要 的 成 
员 函 数 。 首 先 ， 我 们 来 看 一 看 可 以 让 线程 加 入 或 退出 集合 的 成 员 函 数 。 
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e join(): 将 当前 线程 加 入 集合 内 
e leave(): 让 当前 线程 退出 集合 


在 创建 suspendibleThreadSet 阶段 ,集合 内 一 个 线程 都 没有 。 各 
个 线程 在 想 加 入 集合 时 调用 join () ， 在 想 退 出 集合 时 调用 leave () 。 

SuspendibleThreadSet 类 中 还 定义 了 要 求 集合 内 所 有 线程 暂停 或 
恢复 的 成 员 函 数 。 





























e suspend all () : 要 求 集合 内 的 所 有 线程 暂停 
e resume all () : 要 求 集合 内 的 所 有 线程 恢复 








调用 了 suspend_all () 的 线程 会 进入 等 待 状态 ， 直 到 所 有 的 线程 
全 部 暂停 。 此 外 ， 如 果 在 等 待 所 有 线程 暂停 的 过 程 中 有 线程 试图 调用 
join() 加 入 集合 ， 那 么 该 线程 也 会 进入 等 待 状态 。 

在 此 之 后 调用 resume_all() 就 可 以 让 集合 内 的 所 有 线程 都 重新 启 
动 ， 因 调用 join () 而 处 于 等 待 状态 的 线程 也 会 脱离 等 待 状态 ， 被 添加 
到 集合 内 。 
册 就 是 说 ， 从 调用 的 suspend_all () 执行 完成 到 调用 resume_ 
all() 之 间 ，SuspendibleThreadSet 内 的 所 有 线程 都 处 于 暂停 状态 ， 
不 会 有 新 的 线程 被 添加 到 集合 内 。 




































































15.2.2 线程 暂停 的 时 机 
调用 suspend_all() 后 , 集合 内 的 线程 并 非 立 即 就 变 为 暂停 状态 。 
各 个 线程 会 在 自己 认为 适合 的 时 机 变 为 暂停 状态 。 
SuspendibleThreadSet 中 定义 了 以 下 两 个 用 来 暂停 集合 内 各 个 线 
程 的 成 员 函 数 。 



































e should _ yield() : 集合 是 否 接收 到 了 和 暂停 全 部 线程 的 请 求 
eyield(): 如 果 整 个 集合 都 被 要 求 暂停 .那么 暂停 当前 线程 




















各 个 线程 要 在 自己 负责 的 处 理 的 间隙 等 方便 暂停 的 时 机 定期 调用 








15.2 SuspendibleThreadSet 类 


yield() ， 这 是 它们 的 义务 。 


15.2.3 ”从 集合 外 调用 yield() 


同 。 

















和 实 上 ， 集 合 外 的 线程 也 可 以 调用 yielq()( 那 





A 
集合 外 的 线程 调用 yie1d () 的 处 理 流程 与 在 集合 内 的 处 理 流程 相 














在 resume_all() 后 再 启动 。 


15.2.4 ”使 用 示例 


在 suspend_all() 被 调用 时 集合 内 只 有 线程 A。 线 程 A 会 定期 j 








前 面 讲解 的 这 些 函 数 的 使 用 示例 如 图 15.2 所 示 。 











suspend all() 
主线 程 一 


joln ty isia(0) vie1ad)] leave () 
一 >- 一 一 一 一 一 一 ——— 


resume all() 
a 





线程 A 
yield() 
线程 再 ee 吉本 十 冲 呈 本 串 语 
yield() yield() 
线程 C 二 一 ~ 


15.2 ”使 用 了 SuspendibleThreadSet 的 线程 的 行为 控制 示例 
灰色 箭头 上 的 处 理会 在 suspend all() 成 功 后 ， 且 线程 A、B 没有 运行 
的 状态 下 执行 。 而 集合 外 的 线程 C 会 在 suspend all() 执行 完成 后 调用 
yield() 时 暂停 执行 。 








> 
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如 果 和 集合 内 部 所 有 线程 都 被 要 求 暂停 ， 那么 线程 会 暂停 当前 线程 ， 


首先 ， 主 线程 调用 suspend_ all () ,要求 集合 中 的 线程 暂停 执行 。 
然后 ， 在 集合 内 的 所 有 线程 都 暂停 后 ，3 


完成 后 调用 resume all ()。 
线程 A 是 唯一 在 suspend _ all () 被 调用 前 就 调用 join () 的 线程 。 因 此 


主线 程 开始 执行 处 理 ， 并 在 处 理 














周 用 


yield() ， 并 且 通 过 suspend all() 后 的 那 次 yield() 调用 来 让 自己 暂停 。 
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线程 B 在 suspend_all() 被 调用 后 才 调用 join () 。 由 于 此 时 线程 
集合 已 经 接收 到 暂停 所 有 线程 的 请 求 ， 所 以 调用 了 join () 的 线程 B 会 
暂停 。 

而 线程 C 尽管 是 与 集合 无 关 的 线程 ， 但 也 会 定期 调用 yield() ， 然 
后 通过 suspend_ all () 被 调用 后 的 那 次 yield() 调用 来 让 自己 暂停 。 
请 注意 线程 C 会 在 一 段 非常 短暂 的 时 间 内 与 主线 程 的 灰色 箭头 的 处 理 同 
时 执行 。suspend_all () 无 法 确保 与 集合 无 关 的 线程 也 会 暂停 执行 。 

总 的 说 来 ， 就 是 suspendibleThreadset 提供 了 一 种 机 制 ， 可 以 在 
集合 相关 线程 处 于 暂停 的 状态 下 进行 某 种 处 理 。 从 图 15.2 就 可 以 知道 ， 
在 与 集合 相关 的 线程 A 和 B 暂停 运行 的 状态 下 ， 主 线程 灰色 箭头 部 分 
的 处 理 才 会 执行 。 各 个 线程 的 暂停 位 置 是 由 join() 和 yield() 的 调用 
时 机 决定 的 。 因 此 ， 集 合 内 的 各 个 线程 可 以 在 自身 处 理 的 间隙 等 安全 的 
位 置 暂停 执行 。 


HotSpotVM 中 存在 一 个 谜 一般 的 术语 一 一 安全 点 。 虽 然 我 们 经 常 看 
到 “系统 整体 的 安全 状态 称 为 安全 点 ”这 种 说 法 ,但 老实 说 ， 这 个 解释 
并 不 能 让 人 理解 到 底 什么 是 “安全 状态 "。 实 际 上 ， 安 全 状态 与 GC 的 
根 ( root ) 密切 相关 。 如 果 不 了 解 GC， 就 很 难 理解 安全 状态 。 因 此 很 容 
易 出 现 上 面 这 种 不 好 懂 的 解释 。 
























































15.3.1 “什么 是 安全 点 

安全 点 是 指 在 程序 运行 过 程 中 可 以 毫 无 矛盾 地 枚 举 所 有 根 的 状态 。 
根 是 在 进行 标记 或 复制 等 操作 时 追溯 对 象 指针 时 的 起 点 部 分 。 因 此 ， 如 
果 无 法 满足 “ 毫 无 矛盾 地 枚 举 ” 和 “ 枚 举 所 有 根 ” 两 个 条 件 ， 就 有 可 能 
漏 掉 存活 对 象 。 

要 想 毫 无 矛盾 地 枚 举 根 ， 最 简单 的 方法 是 禁止 在 枚 举 过 程 中 改变 
根 。 就 这 一 点 而 言 ， 暂 停 mutator 等 会 改变 根 的 线程 是 最 简单 的 方法 。 
因此 ，HotSpotVM 中 的 安全 点 是 暂停 所 有 Java 线程 
































O 
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但 并 不 是 简单 地 暂停 所 有 Java 线程 。 在 暂停 线程 之 前 ， 必 须 将 属于 
自己 的 根 放 到 GC 能 看 见 的 位 置 。 否 则 ，GC 就 无 法 找到 所 有 的 根 。 

JIT 编译 器 就 是 一 个 具体 的 例子 。JIT 编译 器 在 编译 方法 时 会 创建 一 
个 称 为 “ 栈 图 ”( stack map ) 的 东西 。 栈 图 表示 栈 和 寄存 器 的 哪个 部 分 
是 指向 对 象 的 引用 。 于 是 ，GC 就 可 以 参考 栈 图 来 枚 举 根 。 由 于 维护 创 
建 出 的 栈 图 会 消耗 一 些 存储 容量 ， 所 以 JIT 编译 需 只 会 在 特定 的 时 机 生 
成 栈 图 。 因 此 ， 作 为 安全 点 ， 和 暂停 线程 的 时 机 必须 是 维护 栈 图 的 时 机 。 
关于 栈 图 ， 我 们 将 在 13.1.9 节 中 详细 讲解 。 

简单 来 说 ， 安 全 点 就 是 mutator 的 所 有 线程 安全 暂停 的 状态 。 这 里 
所 说 的 “安全 暂停 的 状态 ”就 是 “可 以 安全 地 枚 举 根 的 状态 ”的 意思 。 















































15.3.2， 并 发 GC 的 安全 点 

并 不 是 只 有 Java 线程 才 有 根 。 例 如 在 3.8 节 中 列举 的 “并 发 标记 处 
理 中 的 对 象 ”就 是 一 个 根 的 示例 。 此 外 ， 转 移 专用 记忆 集合 维护 线程 也 
是 与 mutator 并 发 执行 的 线程 ， 转 移 专用 记忆 集合 线程 集合 也 会 被 当 作 
根 使 用 。 也 就 是 说 ， 即 使 是 这 些 并 发 GC 线程 ， 也 需要 先 将 根 放 在 GC 
看 得 见 的 地 方 之 后 再 暂停 执行 。 

下 面 要 出 场 的 是 15.2 节 中 讲解 过 的 内 容 。 我 们 首先 看 一 看 用 来 开始 
安全 点 的 SafepointSynchronize: :begin() 函数 的 一 部 分 。 















































Share/vm/zuntime/safepoint .cpp 
101: void SafepointSynchronize::begin() { 
3 ConcurrentGCThread: :safepoint synchronize(); 


从 上 面 这 段 代码 中 我 们 可 以 看 到 第 117 行 调 用 了 ConcurrentGCcThread 
的 safepoint synchronize() 图 数 。 





share/vm/gc_ implementation/shared/concurrentGCThread.cpp 


57: void ConcurrentGCThread: :safepoint synchronize() { 
Sos uendau NE 
59: } 
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第 58 行 代 码 中 的 _sts 就 是 SuspendibleThreadSet。 这 行 代码 调 
用 了 suspend all() 函数 。 

接 下 来 , 我 们 再 来 看 一 看 结束 安全 点 的 SafepointSynchronize: :end |() 
函数 的 一 部 分 。 























share/vm/runtime/safepoint .cpp 
397: void SafepointSynchronize::end() { 


480 : ConcurrenteErhread Safepomtdesynchronize ly, 





这 次 调用 的 是 safepoint desynchronize() 子 数 。 在 
safepoint_desynchronize() 内 部 只 需 调 用 SuspendibleThreadSet 
的 resume all ()。 

也 就 是 说 ， 安 全 点 使 用 suspendibleThreadSet 来 控制 并 发 GC 线 
程 的 行为 。 并 发 GC 线程 群 在 进入 安全 点 后 会 在 能 够 安全 地 枚 举 根 的 状 
态 时 调用 yield() ， 让 自己 暂停 。 


HotSpotVM 中 有 一 个 特殊 的 线程 叫 作 VM 线程。 在 整个 
HotSpotVM 中 只 有 一 个 VM 线程 在 工作 。 它 的 作用 是 接收 涉及 整个 VM 
的 “VM 操作 ”请 求 ， 并 执行 这 些 请 求 。 





























15.4.1 ”什么 是 VM 线程 


VM 线程 是 用 VMThread 类 定义 的 线程 。VMThread 类 的 祖先 类 中 当 
然 也 包括 Thread 类 。 当 Java 启动 后 ，VM 线程 会 立即 被 创建 出 来 并 开 
始 执行 。 








share/vm/runtime/vmThread.hpp 
101: class VMThread: public NamedThread { 


// 执行 VM 操作 


2 Statue vordlexecutel(VMIOperat ion* opp) 
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VM 线程 内 部 有 一 个 接收 VM 操作 的 队列 。 其 他 线程 以 VM 操作 为 
参数 调用 第 128 行 代码 中 的 execute () 静态 成 员 函 数 ， 由 此 将 VM 操 
作 添 加 到 内 部 队列 中 。VM 线程 在 检测 到 队列 中 新 添加 的 VM 操作 后 ， 
就 会 执行 VM 操作 的 处 理 。 








15.4.2 ”VM 操作 


典型 的 VM 操作 有 获取 栈 跟 踪 、 结 束 VM 和 获取 VM 堆 的 转 储 
( dump )。 与 GC 关系 最 紧密 的 操作 ， 是 必须 要 通过 所 谓 的 Stop-the- 
World 机 制 来 进行 的 暂停 处 理 。 在 G1GC 中 ， 转 移 和 并 发 标记 的 暂停 处 
理 都 是 作为 VM 操作 交 由 VM 线程 执行 的 。 此 外 , 在 Java 中 显 式 地 执 
行 完 全 GC 时 也 是 暂停 处 理 ， 因 此 它 也 是 作为 VM 操作 由 VM 线程 执 
行 的 。 

几乎 所 有 的 VM 操作 都 需要 在 安全 点 执行 。 因 此 在 VM 操作 被 执行 
时 ，VM 线程 一 般 会 调用 safepointSynchronize::begin() 来 进入 安 
全 点 状态 。 











bb 






































15.4.3 VM_Operation 类 





VM_Operation 类 是 用 来 定义 VM 操作 接口 的 类 。VM_operation 
类 的 继承 关系 如 图 15.3 所 示 。 


VM Operation 







VM GC Operation VM GetMultipleStackTraces 
人 






VM GlCollectFull|| VM GenCollectFull VM_ HeapDumper 


图 15.3 VM_Operation 类 的 继承 关系 
让 我 们 看 一 下 VM_Operation 类 的 接口 。 
share/vm/runtime/vm operations.hpp 


98: class VM Operation: public CHeapobj { 
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// VM 线程 调用 的 方法 











ES void evaluate () ; 

144: virtual void doit() = 0; 

145: virtual bool doit prologue() { return true; }; 
146: virtual void doit epilogue() 人 








VM 线程 会 调用 第 135 行 代码 中 的 evaluate () 成 员 函 数 来 执行 ? 
请 求 的 操作 。evaluate () 内 部 只 会 简单 地 调用 第 144 行 的 doit ()。 

第 144 行 至 第 146 行 代码 中 定义 了 三 个 虚 函 数 。doit () 是 在 VM 
线程 上 作为 VM 操作 执行 的 函数 。 硕 名 思 义 ，doit_prologue () 是 在 
执行 doit () 之 前 进行 准备 工作 的 函数 。doit_prologue () 会 返回 一 个 
布尔 类 型 的 值 ， 如 果 它 返回 false，doit () 就 不 会 执行 。doit_ 
epilogue () 是 在 doit () 执行 完毕 后 才 被 执行 的 函数 。 

继承 自 VM_Operation 的 类 中 会 实现 上 面 这 三 个 虚 函 数 ， 并 在 其 中 
编写 有 VM 操作 的 具体 内 容 。 






























































15.4.4_VM 操作 的 执行 示例 __ 
下 面 我 们 来 看 一 看 VM 操作 的 执行 示例 。 这 里 以 G1GC 并 发 标记 的 
初期 标记 阶段 为 例 进行 讲解 。 由 于 初期 标记 阶段 会 进行 暂停 处 理 ， 所 以 
它 会 被 当 作 VM 操作 执行 。 
































share/vm/gc implementation/gl/concurrentMarkThread.cpp 


134: CMCheckpointRootsInitialClosure init cl(_ cm); 
135 Streopvlveroosenst ee niin na, 

GE: WMICGECIOperatnon opl(emnut lel verbosenste) 
TBE VMThread: :execute (&op); 


第 136 行 代 码 会 在 栈 上 创建 VM _cGC _ operation， 并 将 其 传递 给 
execute()。 男 外 ， 各 个 操作 所 需 的 数据 会 被 传递 给 VM 操作 的 构造 了 
数 。 本 例 中 传递 的 数据 是 CMCheckpointRootsInitialClosure 以 及 一 
个 字符 串 。 

调用 了 execute () 的 线程 会 在 VM 操作 完成 之 前 一 直 阻 塞 。 尺 管 有 
些 VM 操作 不 会 被 阻塞 ,但 那 是 很 少见 的 情况 ， 因 此 本 书 就 不 讲解 了 。 





























本 章 将 讲解 G1GC 的 并 发 标记 是 如 何 实现 的 。 不 过 ， 如 果 只 是 再 复 
述 一 遍 算 法 篇 中 已 经 介绍 过 的 实现 部 分 就 太 无 趣 了 ， 因 此 本 章 将 省 略 那 
些 内 容 ， 来 讲解 那些 在 算法 篇 中 未 曾 触及 的 内 容 。 








[ 洒 几 并 发 标记 的 全 貌 


首先 我 们 来 看 一 看 并 发 标记 的 全 貌 。 





16.1.1 “执行 步骤 
这 里 ， 我 们 先 回顾 一 下 算法 篇 中 的 内 容 
并 发 标记 过 程 大 致 可 以 分 为 以 下 5 个 步 又 。 








并 发 标记 的 执行 步骤 。 





中 初始 标记 阶段 
@) 并 发 标记 阶段 
@) 最 终 标 记 阶 段 
存活 对 象 计数 
@@ 收尾 工作 





中 是 进行 根 扫描 的 步骤 。 这 一 步 又 是 在 安全 点 上 执行 的 。 

G@ 是 对 中 中 标记 出 来 的 对 象 进行 扫描 的 步骤 。 这 一 步骤 与 mutator 
并 发 执行 ， 而 且 在 多 个 线程 上 并 行 执行 。 

是 对 己 中 没有 标记 完 的 对 象 进行 扫描 的 步骤 。 这 一 步骤 也 是 在 安 
全 点 上 执行 ， 而 且 在 多 个 线程 上 并 行 执行 。 
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网 是 计算 各 个 区 域 中 被 标记 的 对 象 的 字 节 数 的 步 又 。 这 一 步骤 与 
mutator 并 发 执行 ， 而 且 在 多 个 线程 上 并 行 执行 。 

@@ 是 对 这 次 标记 阶段 进行 收尾 ， 并 为 下 一 次 标记 做 准备 的 步 又 。 这 
一 步骤 也 在 安全 点 上 执行 ， 而 且 也 在 多 个 线程 上 并 行 执行 。 

并 发 标记 以 上 面 5 个 步骤 为 1 个 周期 ， 在 需要 的 时 候 执 行 。 











16.1.2 ”ConcurrentMark 类 
FP 实现 的 。 下 面 我 们 





并 发 标记 的 各 个 处 理 是 在 ConcurrentMark 类 
简单 地 看 一 下 这 个 类 的 定义 。 








share/vm/gc implementation/g1/concurtrentMark .hpp 


359: class ConcurrentMark: public CHeapobj { 


六 5 Ceomeur erentManl threacd mea 

SG G1lCollectedHeap* ee na 

BN Se _parallel marking threads; 
8392 CMBitMap _markBitMapl; 

3935 CMBitMap _markBitMap2; 

394: CMBitMapRO* _prevMarkBitMap; 

3957 CMBiEMap* _nextMarkBitMap; 








第 375 行 的 _cmThread 中 存放 着 并 发 标记 线程 ， 第 376 行 的 _glh 
中 存放 着 用 于 G1GC 的 VM 堆 。 

第 377 行 的 _parallel marking threads 中 存放 的 是 在 并 行 标记 
中 要 使 用 的 线程 数 。 

第 392 行 和 第 393 行 会 分 配 VM 堆 所 对 应 的 BitMap 对 象 。 对 于 
CMBitMap 类 ， 我 们 将 在 16.2.5 节 进 行 详细 讲解 。 

第 394 行 的 _prevMarkBitMap 是 指向 markBitMapl 或 
_markBitMap2 的 指针 ， 第 395 行 的 _nextMarkBitMap 也 是 。 不 同 的 是 
_prevMarkBitMap 指向 的 是 VM 堆 整 体 的 prev 位 图 ， 而 _nextMarkBitMap 
指向 的 是 next 位 图 。 
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16.1.3 ConcurrentMarkThread 类 


并 发 标记 线程 实现 于 ConcurrentMarkThread 类 中 。 该 类 继承 于 
ConcurrentGCThread 类 ， 它 的 实例 被 创建 出 来 后 线程 会 启动 。 





! 








share/vm/gc implementation/gl/concurrentMarkThread.hpp 


36: class ConcurrentMarkThread: public ConcurrentGCThread { 


EE ConcurrentMark* em 
BO VOL US5SGDT tameee 
Sl volatlee Loo li ohoke pees 


从 第 49 行 代码 中 可 以 看 到 ，concurrentMarkThread 有 一 个 成 员 
变量 cm， 其 中 存放 的 是 指向 ConcurrentMark 类 的 指针 。 

第 50 行 的 _started 是 表示 有 没有 开始 执行 并 发 标记 请 求 的 标志 位 。 
第 51 行 的 _in_progress 是 表示 并 发 标记 是 否 处 于 执行 中 的 标志 位 。 














16.1.4 ”开始 执行 并 发 标记 
并 发 标记 线程 在 启动 后 会 立即 调用 sleepBeforeNextCycle () 。 
share/vm/gc implementation/gl/concurrentMarkThread.cpp 
93: void ConcurrentMarkThread::run() { 
103: while (! should terminate) { 


SE sleepBeforeNextCycle(); 

















顾名思义 ，sleepBeforeNextCycle() 是 在 下 次 执行 周期 开始 之 前 
都 处 于 等 待 状 态 的 成 员 函 数 。 下 面 我 们 详细 地 看 一 看 这 个 函数 。 





share/vm/gc implementation/gl/concurrentMarkThread.cpp 
329: void ConcurrentMarkThread: :sleepBeforeNextCycle() { 


334: Mutexnockerhz x (CeCmlock ver nolsatepornntenecrasleo 
335: while (!started()) { 

B36: Cecmock ventlMutex :nosatepol ntlchnecrnn la 

7; } 

338: set in progress () ; 
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Se euecarmstarted, 
S400 


在 第 334 行 ， 并 发 标记 线程 会 锁 住 cGC_1lock 这 个 全 局 的 mutator， 
然后 在 第 336 行进 入 等 待 状态 。 如 果 并 发 标记 线程 的 等 待 状态 被 解 开 
了 ， 和 那么 它 会 在 第 338 行将 _ in_progress 设置 为 true， 在 第 339 行 
将 _started 设置 为 false。 

在 想 解 除 sleepBeforeNextCcycle () 内 的 等 待 状态 ， 即 想 让 并 发 
标记 线程 执行 下 一 轮 处 理 时 ， 必 须 将 _started 设 置 为 true， 并 对 
CGC_lock 进行 notify ()。 负 责 进行 这 个 处 理 的 是 GlcollectedHeap 





























类 的 doconcurrentMark () 函数 。 
share/vm/gc implementation/g1/glCollectedHeap.cpp 
3047: void 


3048: GlCollectedHeap::doConcurrentMark() { 
3049: Mutexiockerex x (Co lock Mutex :nosafepormt eneeck flag) 


3050: if (! cmThread->in progress()) { 
S005: emrhnnead Sseebstanrted 
S3052E Coemliock no 

S3052: } 

30542 } 


第 3051 行 代码 会 先 将 _started 设置 为 true， 然 后 紧 接着 对 cGC_ 
lock 进行 aotify()。 此 外 ， 第 3050 行 的 if 语句 确保 了 set 
started() 不 会 在 并 发 标记 执行 过 程 中 被 调用 。 

如 算法 篇 5.8 节 中 所 述 ， 并 发 标记 只 会 在 转移 完成 后 开始 执行 。 




















16.1.5 _ 并 发 标记 的 周期 

ConcurrentMarkThread 的 run() 限 数 的 while 循环 中 实现 了 一 次 

并 发 标记 周期 。 由 于 run () 函数 是 一 个 超过 200 行 代码 的 大 函数 ， 所 以 
下 面 仅 节选 了 在 讲解 并 发 标记 周期 时 所 需 的 代码 。 














share/vm/gc implementation/gl/concurrentMarkThread.cpp 


93: void ConcurrentMarkThread: :run() { 





200%: 


S02 
0 


} 
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while (! should terminate) { 


sleepBeforeNextCycle(); 


{ 


/* @ 并 发 标记 阶段 */ 
if (!cm()->has aborted()) { 
_cm->markFromRoots (); 


} 
4 


* 





3) 最 终 标 记 阶 段 */ 
(!cm()->has aborted()) { 


CMehnecrpointRootespinalClosure finalcl( Bem 
SPEfl(verbose Gr Gomme 
VMECGCIOPerae on onset nnale ve 
VMThread: :execute (&op) ; 


} 


/* (四 存活 对 象 的 计数 */ 
if (!cm()->has aborted()) { 


Se Mal)s 
_cm->calcDesiredRegions(); 
_sts.leave(); 


} 


/* (@) 收尾 工作 */ 
if (!cm()->has aborted()) { 














GE 
SmERKEDSSEESELCCECTSanUOL 
WICGCEOperation op (sce verbosensee 
VMThread: :execute (&op) ; 


} 


/* 清理 next bitmap */ 
Es om 
_cm->clearNextBitmap () ; 
_sts.leave(); 


terminate (); 
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上 面 的 处 理 中 没有 步骤 中 的 初始 标记 阶段 。 这 是 因为 初始 标记 阶段 
实际 上 是 与 转移 一 起 执行 的 处 理 。 即 使 是 在 转移 过 程 中 ， 也 不 得 不 为 了 
复制 对 象 而 进行 根 扫描 。 由 于 在 并 发 标记 中 进行 相同 的 处 理 也 只 是 浪 
费 ， 所 以 标记 与 转移 的 根 扫描 就 一 起 执行 了 。 

第 143 行 至 第 145 行 代码 是 步 又 @ 的 并 发 标记 阶段 。 第 144 行 代码 
中 的 markFromRoots () 是 负责 对 初期 标记 阶段 中 标记 出 的 对 象 进行 扫 
描 的 成 员 函 数 。 

第 150 行 至 第 169 行 是 步 又 @ 的 最 终 标记 阶段 。 这 一 步 使 用 VM 操 
作 执 行 处 理 。 

第 190 行 至 第 211 行 是 步 又 由 的 存活 对 象 计数 。 从 代码 中 可 以 看 出 
这 段 处 理 使 用 了 suspendibleThreadset。 

第 218 行 至 第 230 行 是 步 又 @@ 的 收尾 工作 。 这 里 也 使 用 了 VM 操 
作 ， 在 内 部 交换 prev 位 图 和 next 位 图 。 

第 287 行 至 第 289 行 要 做 清理 next 位 图 的 工作 。 这 是 在 为 下 一 次 
并 发 标记 准备 位 图 。 

各 个 步骤 的 if£ 语句 中 的 has_aborted() 会 在 并 发 标记 想 以 某 种 理 
由 中 断 时 返回 true。 并 发 标记 变 为 aborted 的 理由 一 般 是 因为 并 发 标记 
周期 内 发 生 了 对 象 转移 。 由 于 转移 后 对 象 自身 会 移动 ， 所 以 必须 重新 对 
位 图 进行 标记 。 因 此 在 发 生 中 断 时 会 跳 过 各 个 步 又 ， 仅 执行 清理 next 
位 图 的 处 理 。 


| 交 届 步骤 (一 一 初始 标记 阶段 


初始 标记 阶段 是 对 可 以 直接 从 根 引 用 的 对 象 进行 标记 的 处 理 。 上 一 
节 中 已 经 提 到 过 ， 该 阶段 会 与 转移 的 根 扫描 一 起 执行 。 第 17 章 将 讲解 
转移 ， 因 此 这 里 只 讲解 与 标记 相关 的 部 分 。 




















































































































16.2.1 根 
HotSpotVM 中 可 以 作为 根 的 对 象 大 致 有 以 下 几 类 。 
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e 各 线程 特有 的 信息 ( 栈 帧 等 ) 

e 内 置 类 

e@ JNI 处 理 需 

e 从 常 驻 内 存 空间 到 其 他 内 存 空 间 的 引用 
e 转移 专用 记忆 集合 

e 其 他 














初始 标记 阶段 以 上 面 这 些 为 根 进行 处 型 


ha 


O 














16.2.2 ” 根 扫描 的 框架 


HotSpotVM 在 SharedHeap 类 中 准备 了 用 来 进行 根 扫描 的 成 员 函 数 


process strong roots()。 

















share/vm/memory/sharedHeap.hpp 


DYE void process strong roots (bool activate scope， 

220% Boore onleec mgneermgeny 
2 ScanningOption so, 

2225 OobeglosmesxEcoowsF 

223% Geodeplopelosure codemootey 
224: OopsInGenClosure* perm blk); 

















[Ce 


个 函数 值得 一 提 的 作用 有 两 个 。 


GD 以 roots 为 参数 调用 do_oop () 函数 (第 222 行 ) 
@) 以 多 线程 执行 时 负责 分 割 任务 


我 们 先 来 看 一 看 中。 第 222 行 的 0opClosure 类 在 迭代 根 时 会 被 
] 到 。 














share/vm/memory/iterator.hpp 
56: class OopClosure : public Closure { 


61: veual ve dooooloeop ee 0 
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该 类 中 定义 了 一 个 ao_oop () 虚 函 数 。 这 个 函数 被 调用 时 的 参数 是 
HotSpotVM 中 的 各 种 根 。do_oop () 是 在 oopclosure 类 的 子 类 中 实 
现 的 。 

下 








而 我 们 来 看 一 看 它 是 如 何在 process_sttrong_roots () 中 被 调 











用 的 。 
Share/vm/memory/shatedHeap .cpP 


TSer RomadESnarcedHeae roces ntrongrtoors boo ivaten oe 


el 


148: Universe::o0ps dol(roots); 

149: Referenceprocessor: :oo0ps do (roots); 

155: JNIHandles::o0ps do(roots); 

下 5 8 Threades :possnblyaparabl loop dr dm 
6BE ObjectSynchronizer::oops do (roots); 

165: FlatProfiler::0o0ps do(roots); 

We Management: :oo0ps do (roots); 

169: JvmtiExport::oops do(roots); 


>) 


从 上 面 的 代码 中 可 以 看 到 ， 调 用 各 个 类 的 静态 函数 oops_do () 时 ， 
会 使 用 roots 作为 参数 。 在 oops_do () 内 ， 会 将 各 个 类 所 管理 的 对 象 
的 引用 转换 为 oop 类 型 的 参数 ， 调 用 oopclosure 的 do_oop () 方法 。 

图 16.1 是 这 部 分 处 理 的 示意 图 。 














图 16.1 
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调用 方 process_strong roots() 


Universe Threads 全 
NN NN 办 行 


do_oop() do_oop() 





各 个 类 对 自己 管理 的 根 调用 在 OopClosure 子 类 中 实现 的 do_oop() 


只 要 像 上 面 这 样 准 备 一 套 搜索 根 的 框架 ， 就 可 以 根据 0opClosure 
的 子 类 的 不 同 ， 让 调用 方 定义 对 根 进行 怎样 的 扫描 。 

接 下 来 讲解 四 的 “以 多 线程 执行 时 负责 分 割 任务 ”"。 当 以 多 线程 并 
行 执行 时 ，process_strong roots () 会 将 根 扫描 任务 分 割 成 适当 的 大 


小 , 通 








过 让 各 个 线程 “ 先 到 先 得 ”来 提高 并 行 执行 时 的 性 能 。 下 面 我 们 


再 次 看 一 下 process_strong roots () 的 实现 。 


share/vm/memory/sharedHeap .cpp 





138; 
147: 
148: 
149: 
LS 
J 
wa: 
Da 


la 


6a 
164: 


3 


verd SnaredHeaes puoceses eon oo bo ac el valenscope, 
el 
Tf (roceseBstrong tasks 
->is task claimed(SH PS Universe oops do)) { 
Universe::0o0ps do(roots); 
RefenenceRrocesso oo eos 
perm gen()->ref processor()->weak oops dol(roots); 
} 
if (I process Strong tasks 
->is task claimed(SH PS JNIHandles oops do)) 
JNIHandles::o0ps do(roots); 


PF ocessn tongeasks 
-=eBEaskiclalimed(SHpSsn obiject Synenronizer ooops do)) 
ObjectSynchronizer: :oo0ops do(roots); 
TEPprocessnStrono tasks 
->is task claimed(SH PS FlatPprofiler oops do)) 
peale pmo fren oore ooo 


164 | 


der 


Lo 
下 全 85 


下 695 


221: 
DOD 


从 
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if "(lprocess strong tasks 
->is task claimed(SH PS Management oops do)) 
Management : :oo0ops do (roots); 
Tr Ges rongasks 
->1s task elaimed (SH PS "jvmtiVNoops do)) 
JvmtiExport::oops dol(roots); 














Wx es 其 他 的 根 扫描 es */ 


process strong tasks->all tasks completed(); 


} 
上 面 的 代码 中 我 们 可 以 看 到 ， 每 次 调用 oops_do() 之 前 ， 


























process_strong roots () 都 会 先 调用 _process_strong tasks 成 员 变 


量 的 is 





task claimed()。 process_ strong tasks 是 SubTasksDone 


类 的 实例 。 

这 个 is_task_claimed() 的 作用 ， 是 检查 作为 参数 的 标识 符 所 对 
应 的 任务 有 没有 被 其 他 线程 认领 。 如 果 已 经 被 其 他 线程 认领 了 ,那么 
会 返回 true， 该 任务 也 不 会 被 执行 ; 如 果 没 有 被 其 他 线程 认领 ， 则 该 任 
务 属 于 当前 调用 的 线程 ， 所 以 返回 false。 由 于 is task claimed () 
在 内 部 使 用 了 CAS 命令 ， 它 的 执行 具有 原子 性 ， 所 以 可 以 在 多 个 线程 















































上 同时 执行 。 
当 并 行 地 执行 process_strong _ roots() 时 ， 上 面 讲解 的 这 种 机 
制 可 以 确保 各 个 线程 以 先 到 先 得 的 规则 执行 if£ 语句 中 的 任务 。 
































16.2.3 ”G1GC 的 根 扫 描 
接 下 来 看 一 看 G1GC 的 根 扫 描 。 下 面 仅仅 展示 了 与 标记 相关 的 代码 。 




















share/vm/gc implementation/g1/glCollectedHeap.cpp 


585 


4620 : 


4643 : 


4651: 


class GlParTask : public AbstractGangTask { 
void work (int i) { 


GlParScanAndMarkExtRootClosure 
Seangmarkarooc coh os 


Scan root cl = &scan mark root cil; 
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4659: glih->g1 process strong roots(/* not collecting perm */ 
Ealses 

4660: SharedHeap: :SO AllClasses, 
4661: Scannrooeyely 

4662: gpush heap rs cil, 

4663: seanlpermiel 

4664: i); 


根 扫描 是 在 GlParTask 的 work () 函数 中 执行 的 。 从 第 4589 行 代 
人 码 中 可 以 看 到 G1lParTask 继承 自 14.3 节 中 讲解 过 的 AbstractGangTask 
类 。 也 就 是 说 ， 这 个 work () 函数 是 可 以 并 行 执行 的 。 关 于 这 一 点 我 们 
会 在 第 17 章 详 细 讲解 。 

第 4643 行 代 码 创建 了 一 个 GlParscanAndMarkExtRootClosure 类 
的 实例 。 该 类 是 0opClosure 类 的 子 类 。 这 个 类 的 do_oop () 函数 会 对 
接收 到 的 根 进行 复制 和 标记 处 理 。 第 4659 行 代码 会 将 这 个 实例 传递 给 
gl1 process strong roots() 的 参数 。 这 个 成 员 函 数 会 在 内 部 调用 


process strong roots()。 





























share/vm/gc implementation/g1l/glCollectedHeap.cpp 


4696: void 
A469 elCoLlectedieaps: 
4698: gl1 process strong roots(bool collecting perm gen, 


4699: SharedHeap: :ScanningOption so, 
4700: OopClosure* scan non heap roots, 
4701: OopsIinHeapRegionClosure* Scan rs, 
2 QopsIinGenClosure* scan perm, 
4703: int worker i) { 

4708: BufferingOopClosure buf scan non heap roots(scan non heap roots); 
EG process strong roots(false, 

下 了 下 EeeEcemnogoecngaenssc 

4718 : &buf scan non heap roots, 

4719 : geagerscanpcodenrootsh 

4720: &buf scan perm); 


/* G1GC 特 有 的 根 扫 描 */ 


4757:  _process strong tasks->all tasks completed(); 
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g1_process_strong_roots() 的 主要 作用 是 对 包括 G1GC 特有 的 
根 在 内 的 所 有 根 进行 根 扫描 。 用 于 转移 专用 记忆 集合 以 及 并 发 标记 的 标 
记 栈 等 就 是 典型 的 例子 。 

此 外 ， 第 4708 行 代码 还 用 Bufferingoopclosure 包 装 了 
OopClosure。 该 类 的 do_oop () 会 将 接收 的 参数 oop 暂时 存储 在 缓冲 区 
中 ， 然 后 等 缓冲 区 存 满 后 一 起 处 理 这 些 参数 。 有 了 这 个 缓冲 区 ， 我 们 就 
以 分 别 测量 “搜索 根 的 时 间 ” 和 “复制 对 象 的 时 间 ”。G1GC 会 在 同 
处 理 所 有 缓冲 区 内 参数 时 测量 一 次 时 间 ， 然 后 在 复制 对 象 ( 这 时 也 会 
进行 标记 ) 时 还 会 测量 一 次 时 间 。 这 样 就 可 以 分 别 测量 出 “搜索 根 的 时 
间 ” 和 实际 的 “复制 对 象 的 时 间 ”， 提 供 更 精确 的 分 析 信息 。 








习 


Tr 
































16.2.4 ” 根 扫 描 时 的 标记 
根 扫 描 中 用 到 的 GlpParscanAndMarkExtRootClosure 类 的 do_ 
oop () 因数 ， 最 终 会 调用 ConcurrentMark 的 grayRoot () 成 员 函 数 。 








share/vm/gc implementation/gl/concurrentMark .cpp 


1005: void ConcurrentMark::grayRoot (oop p) { 
006: HeapWord*addr = (HeapWord*) 


LOMS: if (! nextMarkBitMap->isMarked (addr)) 
Ol: _nextMarkBitMap->parMark (addr); 
TO 





grayRoot () 的 参数 p 所 接收 的 值 是 复制 目标 的 地 址 。 第 1015 行 代 
码 会 检查 有 没有 打上 标记 ， 第 1016 行 代码 会 标记 next 位 图 。 

对 所 有 的 根 都 调用 上 面 的 grayRoot () 后 ,初始 标记 阶段 就 结 
束 了 。 





16.2.5 “位 图 的 并 行 化 方法 

CMBitMap 是 表示 next 位 图 的 类 。 这 个 类 会 在 构造 函数 中 创建 

BitMap 类 的 实例 并 将 其 保存 在 成 员 变 量 _pm 中 。 这 个 _bm 才 是 位 图 的 
实体 ，CMBitMap 不 过 是 对 _bm 的 代理 而 已 。 
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share/vm/gc_ implementation/gl/concurrentMark.hpp 





123: class CMBitMap : public CMBitMapRO { 

131: void mark (HeapWord* addr) { 

134: _bm.at put (heapWordToOffset (addr), true); 

a5  } 

6 void clear (HeapWord* addr) { 

L139 _bm.at put (heapWordToOffset (addr), false); 

上 0 

下 4 bool parMark (HeapWord* addr) { 

144: return bm.par at put (heapWordToOffset (addr), true); 
5 

146 : bool parClear (HeapWord* addr) { 

TAQ Peeurnbn eariat pue (neapWordlioof set (adde) Ealse)s 
LS } 


CMBitMap 继承 自 CMBitMapRO。CMBitMapRO 中 的 RO 是 ReadOnly 
的 缩写 ， 它 是 一 个 无 法 标记 和 清除 标记 的 类 。 而 继承 自 CMBitMapR0 的 
CMBitMap 扩展 了 它 的 功能 ， 可 以 标记 和 清除 标记 。 

CMBitMap 有 两 种 标记 方法 : 并 行 化 和 非 并 行 化 。 第 131 行 至 第 140 
行 代码 中 定义 的 mark () 、clear () 是 非 并 行 化 的 函数 ， 而 第 141 行 往 
后 的 代码 中 定义 的 parMark () 、parCclear () 是 并 行 化 的 函数 。 初 始 标 
记 阶 段 中 有 并 行 执行 处 理 ， 因 此 使 用 的 是 parMark () 。 

在 第 144 行 和 第 149 行 调用 的 BitMap 的 par at put() 是 
parMark () 和 parclear ( ) 中 处 理 的 实体 ， 我 们 来 看 一 看 这 个 函数 的 
定义 。 






































share/vm/utilities/bitMap.cpp 


260: bool BitMap::par at put(idx t bit, bool value) { 
人 26 ES arc tml rl ara 
262: } 


53: inline bool BitMap::par set bit(idx t bit) { 
55s vot nda conseeddr SwornEaddr le 


S58 const idx t mask = bit mask (bit); 

人 Gb e Oe Ve Ee EGG 

58 

59: do { 

6UF const idx t new val = old val | mask; 


GE USEREESOUOREDL 


168 | 


有 2 
ES 
64: 


5 
66: 
GT 
68: 
(S08 
TO 
ls 
了 2 


} 
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meltvneialses 
} 
eonst udxat eurnval = (ae Atonmme emoxehgnperl 
(void*) new val, 
(volatile void*) addr, 
(von ond va 
LE {nn va EE Be val) | 
Pet Urn teu 
} 
GOTai coryvaly 
} while (true); 











par_at_put () 会 在 内 部 调用 par set bit() 或 par clear bit()。 
这 两 者 的 处 理 非常 相似 ， 因 此 这 里 只 看 一 下 par_set_pbit () 即 可 。 

在 第 53 行 接收 到 的 bit ta 在 第 55 行 获 
取 的 地 址 (addqr ) 指向 1 个 字 的 内 存 空间 ， 该 空间 拥有 对 应 于 地 址 的 
位 。 在 第 56 行 创建 1 个 字 的 位 掩 码 (mask )， re ee 目标 


位 的 值 为 1。 在 第 57 行将 addr 所 指向 的 1 个 字 保 存在 局 部 变量 中 。 




















在 第 60 行 创建 一 个 目标 位 的 值 为 1 的 新 值 (new_val )， 并 在 第 64 
行 执行 CAS 命令 。cmpxchg ptr() 将 *addr 的 值 与 olq_val 进行 比 


较 ， 如 曙 


cmpxc 


























相等 则 将 new_val 写 到 *aqddr 中 ， 如 果 不 相等 则 什么 都 不 做 。 
hg_ptr () 的 返回 值 是 *addr 被 改变 前 的 值 ， 因 此 像 第 67 行 那 











样 ， 与 old_val 进行 比较 就 可 以 判断 写 值 是 否 成 功 。 如 果 cur_val 和 
old_val 的 值 相等 ， 则 表示 写 值 成 功 ，par_set_bit () 会 返回 true。 
如 果 不 相等 ， 则 表示 其 他 线程 修改 了 *addr 的 值 ， 第 70 行 代码 会 将 
old_val 的 值 更 新 为 最 新 的 值 ， 然 后 进行 循环 处 理 。 

为 了 防止 数据 不 匹配 ，par_at_put () 会 像 上 面 这 样 使 用 CAS 命令 
修改 位 的 值 ， 实 现 允 许多 线程 同时 进行 标记 的 功能 。 


L 天 甬 步骤 2 盖 并 发 标记 阶段 


步骤 @ 将 初始 标记 阶段 标记 的 对 象 与 mutator 并 发 进行 扫描 。 在 
ConcurrentMarkThread 的 run() 困 数 中 ， 从 调用 markFromRoots () 
开始 就 进入 并 发 标记 阶段 了 。 


















































建 cMConcurrentMarkingTask， 并 在 第 1178 行 代码 中 让 并 发 标记 线程 
并 发 执行 这 个 任务 。 如 果 并 发 标记 中 使 用 的 线程 数量 为 0， 则 不 进行 并 
发 处 理 。 不 过 不 管 怎 样 ， 
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share/vm/gc_implementation/g1/concurrentMarkThread.cpp ( 再 次 贴 出 ) 


93: void ConcurrentMarkThread::run() { 


/* 四 并 发 标记 阶段 */ 


a3E if (!cm()->has aborted()) { 
144: _cm->markFromRoots (); 
145: } 


share/vm/gc implementation/gl/concurrentMark.cpp 


1162: void ConcurrentMark: :markFromRoots() { 

下 6 CMConcurrentMarkingTask markingTask (this, cmThread()); 
下 友好 (analelmar no 0 

la _parallel workers->run task(&markingTask); 

LO else 

50 markingTask .work (0); 

8 } 








从 第 1162 行 代码 开始 ，ConcurrentMark 的 markFromRoots () 会 创 
































这 个 任务 都 是 在 并 发 标记 线程 中 执行 的 ， 因 此 





+ 


它 会 与 mutator 并 发 执行 。 





share/vm/gc implementation/gl/concurrentMark.cpp 


1089: class CMConcurrentMarkingTask: public AbstractGangTask { 
1095: void work(int worker i) { 
blo CMrask* thetask =—Mem >task (workerol)y 

L133; the task->do marking step( 

mark step duration ms, 

114; true /* do stealing 人 

il teuen/* Tacomtermmatlomn 二 人 下 
Te 








在 任务 类 的 work () 中 ， 第 1105 行 代 码 会 将 ConcurrentMark 中 按 




















照 线程 数量 事先 准备 好 的 任务 CMTask 取 一 个 出 来 ， 然 后 调用 do_ 
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marking step () 。 

do_marking_step() 会 对 算法 篇 2.5.1 节 讲 解 的 SATB 队列 集合 和 
在 初始 标记 阶段 标记 出 的 对 象 进行 扫描 。 扫 描 处 理 不 仅 无 趣 而 且 非 常 复 
杂 ， 因 此 本 书 省 略 这 部 分 的 讲解 。 只 要 理解 了 算法 篇 中 有 关 扫 描 的 知 
识 ， 就 不 会 有 什么 问题 。 


OE 


工作 窃取 
在 并 发 标记 阶段 ， 需 要 使 用 多 个 线程 来 完成 扫描 对 象 这 项 任务 。 这 里 
需要 注意 的 是 工作 量 的 问题 。 如 果 分 给 线程 A 的 工作 量 过 多 ， 那 么 线程 B 
就 必须 等 待 线程 A 执行 完成 。 此 时 不 能 给 线程 B 新 的 任务 ， 只 能 让 它 干 
等 。 这 太 浪 费 了 ， 我 们 不 能 让 计算 机 偷懒 。 
也 许 有 读者 会 想 ， 只 要 事先 给 这 些 线程 分 配 相 同 工 作 量 的 任务 不 就 可 
以 了 吗 ? 但 这 在 多 数 情况 下 是 不 可 行 的 。 因 为 精确 地 测量 任务 量 非常 消耗 
性 能 。 就 本 例 来 说 ， 扫 描 对 象 这 项 任务 的 工作 量 取决 于 对 象 引 用 关系 的 深 
度 。 而 调查 对 象 的 引用 关系 会 消耗 很 多 性 能 。 
为 此 ， 这 里 的 并 发 标记 阶段 会 使 用 工作 窃取 ( work stealing ) 算法 来 
平衡 多 个 线程 的 工作 量 。 在 使 用 工作 窃取 后 ， 线 程 B 在 完成 自己 的 任务 
后 不 会 无 谓 地 等 待 线 程 A， 而 会 尝试 窃取 线程 A 的 工作 。 
HotSpotVM 中 有 一 个 可 以 轻松 使 用 工作 窃取 算法 的 工具 类 库 。 工 作 
窃取 算法 主要 被 用 于 并 发 标记 中 。 这 种 算法 非常 有 趣 ， 感 兴趣 的 读者 可 以 
深入 研究 一 下 。 




























































































































































































































































































元 盟 步骤 G) 一 一 最 终 标 记 阶 段 


步骤 @@ 会 暂停 mutator， 对 没有 标记 完 的 对 象 进行 扫 描 。 在 
ConcurrentMarkThread 的 run() 函数 中 使 用 VM_cGC operation 后 
就 进入 最 终 标记 阶段 了 。 











share/vm/gc_implementation/g1/concurrentMarkThread.cpp ( 再 次 贴 出 ) 
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/* 最终 标 记 阶段 */ 





150: if (!cm()->has aborted()) { 

165: CMCheckpointRootsFinalClosure final cl( _ cm); 
166: sprmnefl(verbosemo tr CC nemamkn 

NG VMECGCEOpDerat Ton op (etmalol verbosenet 
SE VMThread: :execute (&op); 

169: } 


VM_CGC_Operation 的 定义 如 下 所 示 。 
share/vm/gc_ implementation/g1/vm _ operations 9g1.hpp 


98: class VM CGC Operation: public VM Operation { 
Dp Weandeleswrex cy 


100.: const char* printGCMessage; 
105: wel ee oll rololat el 
ll 


VM_CGC_Operation 继承 自 VM_Operation， 它 的 构造 函数 会 获取 
VoidClosure 等 。 


share/vm/gc implementation/gl/vm operations gl1.cpp 
156: void VM CGC Operation::doit() { 

164: lv on 

168: } 


作为 VM 操作 的 核心 部 分 ，doit () 只 会 调用 _cl 的 do_void()。 
doit () 在 执行 时 已 经 处 于 安全 点 状态 ，mnutator 不 会 工作 。 





share/vm/gc implementation/gl/concurrentMarkThread.cpp 


66: class CMCheckpointRootsFinalClosure: public VoidClosure { 
68: eoncuerent ar em 


Ge3 ue 

TO 

be CMCheckpointRootsFinalClosure (ConcurrentMark* cm) 
TD em(em 

D3 


pep oe ero on 
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WS _cm->checkpointRootsFinal (false); 

76: } 

TS be 

CMCheckpointRootsFinalClosure 类 的 do_void() 只 会 调用 
ConcurrentMark 的 checkpointRootsFinal ()。 

这 个 checkpointRootsFinal () 内 部 会 以 多 线程 并 行 地 扫描 在 并 
发 标记 阶段 没有 扫描 到 的 对 象 。 关 于 这 一 点 ， 只 需要 理解 算法 篇 2.6 节 
中 的 内 容 就 可 以 了 。 


出 步骤 (4 一 一 存活 对 象 计数 


步 又 由 会 检查 next 位 图 ， 然 后 计算 各 个 区 域 存活 对 象 的 字 节 数 。 























share/vm/gc_implementation/g1/concurrentMarkThread.cpp ( 再 次 贴 出 








/* 四 存活 对 象 计数 */ 


190: if (!cm()->has aborted()) { 
E98 SDSL 

199e _cm->calcDesiredRegions(); 
200F _sts.leave (); 

LS } 





第 199 行 代码 中 的 calcDesiredRegions() 就 是 对 存活 对 象 进行 计 
数 的 成 员 函 数 。 由 于 第 198 行 代 码 调 用 了 suspendableThreadSset 的 
join () ， 因 此 不 会 发 生 在 安全 点 上 对 存活 对 象 计数 的 情况 。 

calcDesiredRegions () 在 检查 各 个 区 域 的 next 位 图 ， 计 算出 带 
标记 的 对 象 的 大 小 总 和 后 ， 会 将 这 个 值 保存 在 HeapRegion 的 _next_ 
marked_pbytes 成 员 变 量 中 。 当 对 所 有 的 区 域 都 计数 完成 后 ， 第 200 行 
代码 会 调用 leave () ， 然 后 进入 下 一 阶段 


LS 届 步 骤 @ 一 一 收尾 工作 


最 后 的 步骤 @ 是 对 这 次 并 发 标记 进行 收尾 ， 为 下 次 并 发 标记 做 
准备 。 
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218 : if (!cm()->has aborted()) { 

2265 GMereanucseclmce 人 cm 

227% SprunGE (vesboscse Cel en 

228E NECGEEOResatnonEobitecl 本 cvwenoosegeee 有 
2 VMThread: :execute (&op) ; 

DOE } 





/* (8) 清理 next 位 图 */ 











287: eee ol 
288: _cm->clearNextBitmap () ， 
289: esleavel 





并 发 标记 线程 会 在 第 226 行 至 第 229 行使 用 VM_cGc_operation 在 
安全 点 进行 收尾 工作 。VM_CGC_OPERATION 内 部 会 调用 cMcleanUnp 的 
do void()。 





share/vm/gc_ implementation/gl/concurrentMarkThread.cpp 


79: class CMCleanUp: public VoidClosure { 


80: ConcurrentMark* _cm; 

Ba Ue 

82: 

837 eMereanvupl(Conceurrent Mark em) 
84: men 

85 

86: void do void(){ 

875 cnse=<leanuo 人 下 

88 : } 

895 属 


do_void() 会 调用 concurrentMark 的 cleanup () 。 其 中 会 交换 各 
全 区域 的 next 位 图 和 prev 位 图 ， 或 者 初始 化 在 并 发 标记 中 会 用 到 的 
变量 。 

之 后 ， 并 发 标记 线程 会 调用 clearNextBitmap () 来 清空 各 个 区 域 
的 next 位 图 。 由 于 在 调用 clearNextBitmap () 前 并 发 标记 线程 会 先 调 
] SsuspendableThreadSet 的 join () 困 数 ， 因 此 在 安全 点 中 并 发 标记 
线程 一 定 会 暂停 。 





赔 信 























本 章 将 讲解 G1GC 中 的 转移 是 如 何 实现 的 。 此 外 ， 本 章 同样 会 省 略 
在 算法 篇 中 已 经 介绍 过 的 内 容 。 








上 局 关 转移 的 全 魏 


首先 来 看 一 看 转移 的 全 貌 。 


17.1.1 ”执行 步骤 
转移 过 程 大 致 分 为 以 下 3 个 步 又 。 








中 选择 回收 集合 
@) 根 转移 
(3) 转移 


步 又 山 是 选择 转移 对 象 的 区 域 ， 即 根据 并 发 标记 阶段 获取 的 信息 选 
择 回 收集 合 。 

步骤 @ 是 将 回收 集合 内 由 根 直接 引用 的 对 象 ， 和 被 其 他 区 域 引用 的 
对 象 都 转移 到 空 区 域 。 

步骤 @B) 是 以 加 中 转移 的 对 象 为 起 点 ， 转 移 它 们 的 子 对 象 。 当 这 一 步 
又 结束 后 ， 回 收集 合 内 的 存活 对 象 就 全 部 转移 完毕 了 。 

此 外 ， 转 移 一 定 是 在 安全 点 上 执行 的 。 因 此 ， 所 有 的 mutator 在 转 
移 过 程 中 都 处 于 暂停 的 状态 。 
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17.1.2 ”转移 执行 的 时 机 

如 算法 篇 5.8 节 介 绍 的 那样 ， 当 新 生 代 区 域 数 达到 上 限时 ， 转 移 就 
会 被 执行 。 在 对 象 的 分 配 过 程 中 ，VM 会 将 对 象 分 配 在 新 生 代 区 域 中 。 
当 新 生 代 区 域 数 达 到 上 限时 ，VM 就 会 执行 转移 。 

下 面 我 们 来 看 一 看 实际 的 代码 。10.4.2 节 曾 经 稍微 讲解 过 attempt _ 
allocation slow() 成 员 函 数 ， 其 中 就 调用 了 转移 。 














局 























share/vm/gc implementation/g1/glCollectedHeap.cpp 


886: HeapWord* GlCollectedHeap::attempt allocation slow( 
tz Wool Enz 


887: unsigned int *gc count before ret) { 
9065 { 
0 MutexLockerEx x(Heap lock); 


/* 省 略 : 空 区 域 的 获取 和 对 象 的 分 配 */ 





/* 成 功 后 return */ 


Di TEsesuren Nn 

912 : return result; 

Oe } 

DEB } 

QB Beswlte "domeolMeetionpausel 


wordasizer ogeeouneDetons ueedo, 


第 906 行 至 第 933 行 代码 会 尝试 分 配 一 个 新 的 空 区 域 。 如 果 新 生 代 
区 域 的 数量 达到 了 上 限 ， 那 么 新 生 代 区 域 的 分 配 就 会 因 无 法 获取 空 区 域 
而 失败 ， 这 时 第 937 行 代码 会 调用 do_collection _ pause () 。 

do_collection pause() 会 像 下 面 这 样 执行 VM 操作 。 












































share/vm/gc implementation/g1/glCollectedHeap.cpp 


al025e HeapWoreameleolleetednap doneollectronnlpausel 

Sizent wordEezey 
3026: unsigned int gc count before, 
3027: bool* succeeded) { 


080 MG hneeolmleet rioneause op 
emcoUnt enetoren 


176 | 第 17 章 转移 


3031: wen aq 本 SmTZ 

3032“ false, 

32103 gpolmey() Snaxlpausentlimenns 人才 四 
3034: GECause: gmncEcoiecEncngoauss 
3035: VMThread::execute (&op); 

3036: 


0 HeapWord re sm ome sve 


3044: eevee sl 
3045:°} 


接着 ，VM_G1IncCcollectionPause 的 doit () 中 会 执行 转移 。 


share/vm/gc _ implementation/g1/vm operations g1.cpp 


72: void VM GlIncCollectionPause::doit() { 
3 Cleomectednap gin elcomerLedneap ncaa 





104:” ”pause succeeded = 
L105: glih->do collection pause at safepoint ( target pause time ms); 
TOG: if ( pause succeeded && word size > 0) { 








/* 省 略 : 往 新 分 配 的 空 区 域 中 分 配 内 存 */ 











Tae 
第 105 行 的 do _collection pause at safepoint () 中 会 执行 转 
移 。 如 果 转 移 成 功 了 ， 那 么 内 存 将 被 分 配 到 转移 后 腾 出 的 空间 中 ，VM 
操作 随 之 结 





17.1.3 do_collection_ pause at safepoint() 








下 面 提取 出 了 讲解 do_collection pause at safepoint() 代码 
时 所 需 的 部 分 。 











share/vm/gc implementation/g1/glCollectedHeap.cpp 


3188: bool 
sulle eelcolmeeredap doncole enon ea ssarronmtel 
double target pause time ms) { 














/* (选择 回收 集合 */ 


S368 gL policy() Schoose CoOllection set\(target pause time ms) 
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/* @、 回 转移 */ 











SSG62R EvacmaceEcolecEongseelli 
3494 : return true,; 
3495: } 
do collection pause at safepoint () 接收 GC 的 暂停 时 间 上 限 
作为 参数 。 第 3336 行 代码 中 的 成 员 函 数 choose_collection set() 
j 于 选择 回收 集合 。 该 函数 会 选择 那些 暂停 时 间 不 会 超过 通过 参数 接收 
到 的 暂停 时 间 上 限 的 回收 集合 。 
第 3362 行 的 evacuate _collection set() 是 转移 选中 的 回收 集 
合 内 存货 对 象 的 成 员 函 数 。 


二 7s 


1.4 ”转移 专用 记忆 集合 维护 线程 


在 


ConcurrentGlRefineThread 类 中 实现 的 。 





算法 篇 3.4 节 我 们 介绍 过 的 转移 专用 记忆 集合 维护 线程 ， 是 在 














ConcurrentG1lRefineThread 类 的 实例 是 在 ConcurrentGlRefine 


类 的 构 


shar 


48: 
60: 


ms 
TA 
80: 
SD 
B22 


B83 
84: 
85” 
86 : 


89 : 
O02 
Ss 
92% 





造 函 数 中 被 创建 出 来 的 。 
e/vm/gc_ implementation/g1/concurrentGlRefine.cpp 


ConcurrentGlRefine::ConcurrentGlRefine() 


{ 


_n worker threads = thread mum() 7 
nithreadee nilworkernthnreade 
resetlthresnoladlstepll 


_threads = NEW C HEAP ARRAY ( 
ConcurrentGlRefineThread*, n threads); 


me Workernilodnortsee mentey Cardueuesele. numparelde 
ConcurrentGlRefineThread *next = NULL; 
Fomine nieve 0 


ConcurrentGlRefineThread* t = 
new ConcurrentGlRefineThread (this, next, 
wormkemlee tse 
nmeacelleyl me 
Xt 
} 
} 





请 看 第 77 行 代码 。 这 行 中 的 thread_num () 函数 会 决定 要 创建 的 
ConcurrentGlRefineThread 的 实例 数量 。 和 在 JVM 的 
启动 选项 中 指定 GlConcRef ineThreads 的 值 来 改变 这 个 threaa 
num() 的 值 。 

ConcurrentGlRefineThread 类 会 在 实例 被 创建 出 来 后 立即 创建 和 
启动 线程 。 在 通过 第 86 行 代码 创建 出 实例 的 同时 ， 转 移 专 用 记忆 集合 
维护 线程 开始 工作 。 

ConcurrentGliRefine 的 构造 也 数 是 由 GlCollectedHeap 的 
initialize() 函数 调用 的 。 






































share/vm/gc implementation/g1/glCollectedHeap.cpp 
1794: jint GlCollectedHeap::initialize() { 


Tarn: eg nw eoncurrentelRefneln 








T 





也 就 是 说 ， 在 创建 VM 堆 时 ， 转 移 专用 记忆 集合 维护 线程 也 已 经 开 
始 工作 了 。 


志和 步骤 4d) 一 一 选择 回收 集合 


我 们 先 看 一 看 步骤 由。 选择 回收 集合 是 在 GlCcollectorPolicy_ 
BestRegionFirst 类 的 choose_collection set () 函数 中 实现 的 。 

选择 回收 集合 时 所 用 到 的 “计算 预测 时 间 ” 都 是 算法 篇 4.2 节 中 已 
经 介绍 过 的 内 容 ， 因 此 本 节 中 将 省 略 这 部 分 的 讲解 。 








17.2.1 ”选择 新 生 代 区 域 


如 和 法 入 5.1 节 中 所 介绍 的 那样 ， 所 有 的 新 生 代 区 域 都 会 被 选 到 加 
收集 合 中 。 












































share/vm/gc implementation/g1/ 
glCollectorpPolicy.cpp:choose collection set () 的 前 半 部 分 


2 one! 
2854 GlCollectorbolicy BestRegionsiret: ChooseEeeolleecihcngset( 
2855: double target pause time ms) { 
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2866: double base time ms = 
predict base elapsed time ms( pending cards); 
2867: double predicted pause time ms = base time ms; 
2869: double time remaining ms = 


targetlpausceeinelne bascmt memmep 


2897: if (in young gc mode()) { 





























/* 将 新 生 代 区 域 添加 到 回收 集合 中 */ 
20323 Ecolec tonases negeseeyneac, 
309837 ecolec ElonEee ems mee et er 
2934: collec Enron Eesnsedetorees 


nc HcSe tay tendedDetore, 





2940: time remaining ms -= 
nedeseenpredleeedlelapsedn nen 
2941: predicteqd pause time ms += 


nelcsebpredletedme leasenmsy 


2974:  } 


第 2866 行 的 predict base elapsed time ms () 函数 会 预测 除 转 
移 区 域 处 理 以 外 的 其 他 处 理 的 暂停 时 间 。 tn 
停 时 间 以 及 实际 暂停 时 间 ， 这 样 反 复 执 行 该 函数 可 以 提高 预测 时 间 的 
精确 度 。 Gi mda en 
时 间 的 局 部 变量 ,第 2869 行 的 time_remaining ms 是 剩余 的 可 能 暂停 
时 间 。 

第 2897 行 的 ijn young_gc_mode() 会 返回 表示 G1GC 是 否 按 分 代 
方式 进行 GC 的 标志 位 。 由 于 G1GC 一 定 会 按 分 代 方式 进行 GIGC， 所 
以 in young gc_mode () 总 是 返回 true。 

第 2932 行 至 第 2934 行 代码 会 将 新 生 代 区 域 添 加 到 回收 
_collection set 成 员 变 量 表示 回收 集合 。 

第 2940 行 至 第 2941 行 代码 会 使 用 事先 计算 好 的 预测 暂停 时 间 来 计 
算 predicted pause time ms 和 time remaining ms。 如 算法 篇 5.6 
节 中 所 说 ， 此 函数 会 根据 过 去 的 执行 记录 计算 预测 暂停 时 间 。 





























en 

















沁 


合 中 。 
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17.2.2 _ 选择 老年 代 区 域 








部 分 新 生 代 GC 会 将 老年 代 区 域 也 添加 到 回收 集合 中 。 


Share/vm/gc implementation/g1/ 








glCollectorPolicy.cpp:choose collection set () 的 后 半 部 分 

2906:000 Emu mode IEOIEXSUnSEocS 

Se Ga 

29 BD ne ecole ronSetenooser SgetNextMarkedReg ronl( 

time remaining ms, 

BB avagmprednee on 

2984: Ae re on 

29855 qeuble recneuednneanses 
predvetyreguonaelapsedn emneamalr ealse) 

9836: time remaining ms “= predicted time me; 

2987: predicted pause time ms += predicted time mes; 


2988: add to collection set (hr); 


/* 省 略 : should continue 的 值 的 设置 */ 


DEE } 

002 } while (should continue); 
S00 0 

3019: } 


第 2976 行 的 fu11l_young_gc() 函数 会 返回 一 个 表示 是 否 为 完全 新 
生 代 GC 的 标志 位 。 如 果 返 回 值 为 false， 就 表示 当前 处 于 部 分 新 生 代 


GC 模式 。 





在 第 2982 行 获取 在 剩余 暂停 时 间 内 能 够 添加 的 区 域 。 如 果 没 有 能 


够 添加 的 区 域 ， 则 返回 NULL。 
如 果 存 在 能 够 添加 的 区 域 , 第 2985 行 的 pre 








dict. reg1i6n. 


elapsed time_ms () 会 计算 出 预测 暂停 时 间 ， 然 后 第 2988 行 代码 会 将 


这 些 区 域 添 加 到 回收 集合 中 。 如 果 最 终 time_remain 





ing_ms () 变 为 负 


数 ， 则 将 should_continue 设置 为 false， 退 出 while 循环 。 
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上 上 改 通 步骤 2 一 一 根 转移 


根 转移 是 指 将 可 以 从 根 直 接 引 用 的 回收 集合 内 的 对 象 转移 到 其 他 空 
区 域 。 











17.3.1 evacuate_collection_set() 


正如 17.1.3 节 中 介绍 的 那样 ， 转 移 是 在 evacuate_collection 
set () 函数 中 执行 的 。 


share/vm/gc_ implementation/g1/g1CollectedqHeap .cpp 


4785: void GlCollectedHeap::evacuate _ collection set() { 


4792: int n workers = (ParallelGCThreads > 0 ? workers() 
>toOtalworkens(y 是 忆 
4793: set par threads(n workers); 


4794: GlPparTask gl par task(this, n workers, task gqueues); 


4802: if (GlCollectedHeap::use parallel gc threads()) { 


4806: workers()->run task(&g1 par task); 
4807:  } else { 

4809: g1 par task.work(0); 

4810: 


evacuate_collection set() 会 创建 并 执行 ( 可 能 的 话 会 并 行 执 
行 ) 16.2.3 节 中 出 现 过 的 GlParTask。 

GlParTask 会 如 前 所 述 ， 调 用 process_strong roots () 对 所 有 的 
根 进行 扫描 ， 如 果 是 G1GC, 则 GlParsScanAndMarkExtRootClosure 
类 的 do_oop () 函数 会 被 调用 。 转 移 对 象 的 处 理 就 实现 在 这 个 do_oop () 
函数 中 。 








17.3.2 ”对 和 象 转移 


do es 最 终 会 调用 G1ParCopyHelper 类 的 copy to _ survivor 
space() ， 将 对 象 转移 到 空 区 域 中 。 其 中 的 处 理 已 经 在 算法 篇 3.8.1 节 上 
ss 此 处 不 再 袭 述 





. 
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17.3.3 _ 复制 函数 


话 时 


有 那么 说 ， 但 什么 都 不 讲 





于 复制 对 象 的 





下 国 








函数 ” 吧 。 











K 


由 不 太 好 ， ee “用 


这 是 我 个 人 认为 很 有 意思 的 一 个 函数 。 





i 是 该 函数 在 G1GC 中 复制 对 象 的 代码 。 


share/vm/gc implementation/g1/glCollectedHeap.cpp 


ey 


Copy: 


alligned disjoint dwords( (Heapword*) old, 


Go 二 Br words>) 


aligned disjoint words 是 Copy 类 的 静态 成 员 男 数 。 


share/vm/utilities/copy.hpp 


114: 


它 的 参数 是 from、to 以 及 要 复 
会 检查 from 和 to 是 否 是 已 经 对 齐 的 值 。 
代码 会 检查 从 from 复制 到 to 时， 内 存 区 域 有 没有 重 羡 。 第 
117 行 代码 中 的 静态 成 员 函 


assert params aligned () 


第 116 行 


static void aligned disjoint words ( 
HeapWord* from, HeapWord* to, size t count) { 
assert params aligned (from, to); 


assertidnusiouni(Eromn to coune, 
pearalngnedds Teme wordsl(iromn eo eounty,. 





} 





在 不 同 操作 系统 中 有 所 不 同 。 





下 











aligned disjoint words () 。 





出 的 对 象 的 字数 。 第 115 行 中 的 


数 pda_ aligned disjoint words() 的 定义 


看 来 看 一 看 在 支持 x86 CPU 的 Linux 操作 系统 中 定义 的 pa_ 


GE ei mnUxexSGTOIESDDD 


3 


74: 
A 
WG: 
区 
78 : 
了 9 
80 : 
8 


static void pd disjoint words( 


HeapWord* from, HeapWord* to, size t count) { 


#ifdef AMD64 
switch 


Case 
Case 
Case 
Case 
Case 
Case 


8 


[| 


(count 


22 
83% 
84: 
855 
86 : 
8 
885 
895 


108; 
OL 


ele 


140: 
141: 


pd _. 


困 数 。 
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cease 2 eo Eomlle 
case 1: to[0] = from[0]; 
case 0: break; 





defaule; 
(void)memcpy (to, from, count * HeapWordSize); 
break; 
} 
#else 
/* 省 略 :其 他 */ 











#endif // AMD64 


} 


static void pd aligned disjoint woras ( 
HeapWord* from, HeapWord* to, size t count) { 
Pondnsyjo meewondel(freom ton eoune), 


} 





aligned disjoint words () 直接 调用 pd disjoint words () 





在 AMD 64 的 CPU 和 其 他 CPU 中 , pd aligned disjoint 


words ( 


理 。 如 有 果 要 复制 的 数据 小 于 等 于 8 个 字 ， 那 么 程序 将 进入 第 76 行 至 第 


84 行 的 


) 的 处 理 是 不 一 样 的 。 首 先 来 看 一 看 在 AMD 64 的 CPU 中 的 处 











波 











case 语 句 的 处 理 中 ,通过 “=” 运 算 符 进行 内 存 复 制 。 否 则 ， 








程序 将 调用 memcpy () 进行 内 存 复制 。 这 可 能 是 因为 ， 如 果 要 复制 的 数 
据 非 常 小 ， 那 么 函数 调用 的 性 能 开销 束 会 显得 格外 大 ， 不 值得 调用 


memcpy 














) 。 


os_ cpu/linux x86/vm/copy_ linux x86.inline.hpp 


Mo 


74: 


89% 
Qs 
Sn 
SS 
ga 
5 
968 
we 
98: 


static void pd disjoint words ( 
HeapWord* from, HeapWord* to, size t count) { 
#ifdef AMD64 


/* 省 略 */ 

#else 

intx temp; 

sm oe ey testl $6,%6 Rd 
Jz BE By 
cmpl Se el 
a ja 2 下 pu 
时 subl %4,%1 pa 
mys movl ($4) ,$3 et 
1 movl (a le 


184 | 第 17 章 转移 


99: " addl 本 ,0 可 

100: " subl 2 可 

101: " jnz 1b 和 

02: jmp 3 省 全 

到 2 ED smovl ut 

104: We nop Wy 

QS a Me Mesonm, Veny Wee Mae Gerna, 
"=r" (temp) 

TS5 :0 Eom (ou 
"3" (temp) 

Os umemory ueeu 

108: #endif // AMD64 

T0909 } 








如 果 是 非 AMD 64 的 CPU， 则 该 函数 会 使 用 内 联 汇编 自己 实现 复制 
操作 。 这 里 简单 地 介绍 一 下 上 面 这 段 处 理 。 

第 92 行 和 第 93 行 代 码 是 检查 count 是 否 为 0 的 处 理 。 第 92 行 代 
人 码 中 的 test1 指令 会 对 count 进行 按 位 与 运算 。 如 果 count 为 0， 则 
第 93 行 代码 中 的 jz 命令 会 让 程序 跳 转 到 第 104 行 。 

第 94 行 和 第 95 行 代码 是 检查 count 是 否 小 于 等 于 32 的 处 理 。 
如 果 count 大 于 32， 那 么 第 95 行 代码 中 的 ja 指令 会 让 程序 跳 转 到 第 
103 行 。 

第 103 行 代 码 执行 的 是 使 用 了 rep 的 字符 串 指令 smov1。smov1l 指 
令 会 被 循环 count 次 ， 将 数据 从 from 复制 到 to 中 。 

第 96 行 至 第 102 行 代码 借助 跳 转 指令 循环 地 进行 复制 。 当 count 
小 于 等 于 32 时 ， 程 序 会 进入 这 段 处 理 。 第 96 行 代码 会 求 出 from 和 to 
的 偏 移 量 ， 并 将 其 保存 在 to 的 寄存 器 中 。 第 97 行 代 码 会 将 Erom 中 一 
个 字 的 数据 保存 在 temp 寄存 器 中 。 第 98 行 代 码 会 将 temp 的 数据 复制 
到 “from + 偏 移 量 ” 的 位 置 (最 开始 的 位 置 是 to 的 起 始 位 置 ) 第 99 
行 代码 会 累加 偏 移 量 。 第 100 行 代码 用 于 将 count 减 去 1。 第 101 行 代 
码 则 会 检查 count 是 否 为 0。 如 果 不 是 0， 则 让 程序 跳 转 到 第 97 行 ， 如 
果 是 0， 则 通过 第 103 行 的 jmp 指令 让 程序 跳 转 到 第 104 行 。 

大 致 就 是 这 样 的 。 这 究竟 会 不 会 比 memcpy () 更 快 呢 ?” 卜 部 昌平 在 
(关于 memset64 的 ) 文章 中 记录 了 对 此 的 测试 结果 和 思考 分 析 。 请 感 兴 
趣 的 读者 一 定 要 阅读 他 的 文章 《追求 最 快 的 memset64》( 日 语 )。 
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这 篇 文章 里 是 memset64 的 测试 结果 ， 那 么 memcpy () 的 结果 会 如 
何 呢 ? 此 外 ，x86 又 会 有 什么 样 的 变化 呢 ?” 对 此 感 兴趣 的 读者 可 以 亲自 
比较 一 下 。 

关于 内 联 汇编 的 写法 ， 我 参考 了 一 篇 名 为 《GCC 内 联 汇编 的 写法 
forx86》( 日 语 ) 的 文章 。 


正 忆 明 步骤 G) 一 一 转移 


在 根 转移 步 又 中 ， 转 移 的 对 象 的 字段 会 被 保存 在 转移 队列 中 。 而 在 
这 个 步骤 中 ， 几 是 被 存储 在 该 转移 队列 中 的 字段 引用 的 子 对 象 都 会 被 一 
个 接 一 个 地 转移 。G1ParTask 中 的 work () 在 根 转移 结束 后 ， 会 调用 
GlParEvacuateFollowersClosure 的 do_void() 函数 。 




















share/vm/gc implementation/g1/glCollectedHeap.cpp 
4620: void work (int i) { 


/* 省 略 : 根 转移 */ 


4666: { 

4668: GlPparEvacuateFollowersClosure evac\ 
olh spss aueues cterminator) 

4669: evac domvoeldloy 

4674: } 


do_void() 会 将 转移 队列 中 存放 的 对 象 一 个 接 一 个 地 转移 。 
share/vm/gc implementation/g1/glCollectedHeap.cpp 
4565: void GlParEvacuateFollowersClosure::do void() { 
4566: StarTask stolen task; 


4567: GlPparscanThreadState* const pss = par Scan state(); 
4568: pss->trim queue(); 


/* 省 略 : 工作 窃取 */ 





4587: } 


第 4567 行 代码 中 的 Gl1ParscanThreadstate 的 实例 内 部 存放 着 转 
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移 队 列 。 由 于 这 个 转移 队列 是 线程 局 部 的 ， 所 以 不 会 存在 某 个 转移 线程 
与 其 他 转移 线程 互相 竞争 的 情况 。 第 4568 行 代 码 中 的 trim_queue ( 
会 一 直 转 移 对 象 ， 直到 转移 队列 为 空 。 

如 果 其 他 线程 的 转移 目标 太 多 ， 那 么 转移 目标 少 的 线程 会 通过 “ 工 
作 窃取 ”来 平衡 工作 量 。 





























1 


算法 篇 4.5 节 中 讲 过 ， 下 一 次 并 发 标记 暂停 处 理会 花费 的 时 间 ， 是 
根据 过 去 的 并 发 标记 暂停 时 间 预 测 出 来 的 。 本 章 将 讲解 HotSpotVM 如 何 
根据 过 去 的 时 间 记录 ， 预 测 下 一 次 的 暂停 时 间 。 

此 外 ,算法 篇 4.4 节 中 讲 过 GC 会 调度 暂停 时 机 。 在 本 章 后 半 部 分 ， 
我 将 带领 大 家 看 一 看 这 是 如 何 实现 的 。 


上 FE; 浊 几 根据 历史 记录 进行 预测 





























所 谓 根据 暂停 时 间 的 历史 记录 计算 下 一 次 的 暂停 时 间 ， 就 是 “基于 
过 去 的 数据 预测 未 来 的 数据 "。HotSpotVM 会 利用 平均 值 和 标准 差 来 预测 
未 来 的 暂停 时 间 。 





18.1.1 均值、 方差 和 标准 差 
HotSpotVM 中 会 用 到 方差 或 标准 差 等 。 首 先 来 讲解 这 几 个 术语 。 
假设 某 个 班级 3 位 同学 的 考试 成 绩 分 别 如 下 所 示 。 








@A: 50 分 
© B: 70 分 
e@e C: 90 分 


那么 A、B、C 这 3 位 同学 的 平均 分 是 多 少 呢 ? 这 很 简单 吧 ? 计算 
方法 如 代码 清单 18.1 所 示 。 
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代码 清单 18.1 A、B、C 的 平均 分 


(S00 7 700 23900) /3 =70 


像 上 面 这 样 “将 各 计算 项 的 值 相 加 然后 除 以 计算 项 个 数 ” 的 计算 称 
为 求 “ 均 值 "。 这 就 是 大 家 最 熟悉 的 求 “ 平 均值 ”。 

下 面 我 们 来 看 一 看 A、B、C 与 基准 值 的 差 值 各 是 多 少 。 表 示 这 个 
差 值 程度 的 值 被 称 为 “标准 差 "。 这 次 我 们 以 平均 值 作为 基准 值 来 尝试 
计算 。 

要 想 知道 各 计算 项 的 偏差 ， 我 们 首先 需要 看 各 计算 项 与 作为 基准 的 
平均 值 的 差 是 多 少 。 简 单 地 说 ， 只 要 通过 “各 计算 项 -平均 值 ” 先 算出 
差 值 ， 然 后 将 它们 相 加 并 除 以 计算 项 的 数量 就 可 以 得 到 偏差 ( 代码 清单 
18.2 )。 让 我 们 来 试 试看 。 
代码 清单 18.2 错误 的 偏差 计算 方法 


(50870 (700 70 (070 33=30 























结果 是 0。 难 道 没有 偏差 吗 ? 不 是 的 ， 只 要 看 A、B、C 的 值 就 会 知 
道明 显 是 有 偏差 的 。 
以 “各 计算 项 -平均 值 ”来 计算 的 问题 在 于 结果 中 可 能 存在 负数 。 
如 果 有 负数 ， 就 会 导致 差 值 被 抵消 。 既 然 负 值 的 出 现 会 带 来 不 利 的 影 
啊 ， 那 我 们 来 尝试 计算 差 值 的 平方 〈 代 码 清单 18.3 )。 


代码 清单 18.3 方差 的 计算 方法 


(SO 770) 20 (0 70 SOON 2 6 















































现在 值 变 成 了 266， 我们 可 以 看 到 确实 有 偏差 。 像 这 样 将 “各 计算 
项 -平均 值 ”的 平方 相 加 并 除 以 计算 项 个 数 得 到 的 结果 称 为 “方差 ”。 
因为 这 个 值 是 通过 平方 值 求 出 来 的 ， 所 以 还 需要 计算 它 的 二 次 方 根 
(平方 根 ) (代码 清单 18.4 )。 
代码 清单 18.4 ”标准 差 的 计算 方法 ( Ruby ) 


Math.sqrt (266) .to i # => 16 使 去 小 数 点 后 的 值 
































结果 是 16。 这 个 值 就 是 前 面 提 到 的 标准 差 。 标 准 差 表 示 偏 差 的 幅 
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度 。 如 果 标 准 差 很 大 ， 则 说 明 各 数据 的 波动 很 大 ; 如 果 标 准 差 为 0， 则 
说 明 没有 偏差 。 在 本 例 中 ， 如 果 A、B、C 的 分 数 都 为 70， 则 标准 差 为 0。 


18.1.2 ”衰减 均值 











HotSpotVM 会 根据 过 去 的 历史 记录 来 预测 下 一 次 暂停 时 间 。 假 设 A 
过 去 5 次 的 考试 成 绩 如 下 所 示 。 





e 第 1 次 : 30 分 
e 第 2 次 : 35 分 
e@ 第 3 次 : 40 分 
e@ 第 4 次 : 42 分 
e 第 5 次 : 50 分 


那么 ， 应 该 如 何 预测 第 6 次 的 考试 成 绩 呢 ? 

HotSpotVM 首先 会 在 记录 分 数 时 计算 衰减 均值 ( decaying average )。 
衰减 均值 和 均值 不 同 ， 它 是 一 种 数据 越 古老 ， 对 均值 的 影响 就 越 小 的 计 
算 方 法 。 我 们 先 来 看 一 看 具体 的 计算 方法 〈 代 码 清单 18.5 )。 


代码 清单 18.5 “衰减 均值 的 计算 方法 ( Ruby ) 


davg = 30 

davee ="935 0 daven. 
davg = 40 * 0.3 + davg * 
davg = 42 * 0.3 + davg * 
davgD = DO 0 daveae. 
davg.to i # => 40 





在 上 面 这 段 代码 中 ， 衰 减 均值 的 计算 方法 是 将 最 新 分 数 的 30%， 和 
历史 记录 中 上 一 次 记录 的 70% 相 加 ， 然 后 将 结果 作为 新 的 历史 记录 。 这 
种 计算 方法 可 以 减少 旧 数 据 对 均值 的 影响 。 


为 了 便于 大 家 形 





E 解 ， 


此 时 ,均值 的 变化 趋势 如 











这 里 假设 A 的 考试 成 绩 为 1 分 的 记录 有 10 次 。 
图 18.1 所 示 。 





190 | 第 18 章 预测 与 调度 



































100% 7 国 画 
"本 证 看 性 
80% 一 一 下 一 一 加 | 一 国 国 门 
70% 图 
60% 了 | 

s0%- | , l 轩 | 
40% 
30% 本 

209%4 ] 
一 
2 不 3 个 4 个 5 个 6 个 7 个 8 个 9 个 10 个 





18.1 均值 的 变化 趋势 了 


而 衰减 均值 的 变化 趋势 如 图 18.2 所 示 。 


100% 

90% 十 | I [一 一 加 天 | 六 一 一 面 | 
80% 7 

70% ] 
60% 国 

$50% 

30% 

20% 

10% 

0% T 

全 和 外 3 


回 Ee 
T T T 画 T | T | 
5 个 6 个 7 个 8 个 9 个 

除 第 1 个 值 外 ， 其 他 值 都 是 越 旧 在 均值 中 所 占 的 比例 越 小 (图 


| 4 全 | i 
18.2 )。 而 最 新 的 值 总 是 占 均值 的 30%。 



































个 “10 个 


图 18.2 ”衰减 均值 的 变化 趋势 
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中 按 文 前 说 明 登 录 图 灵 社 区 本 书 主 页 ， 点 击 页 面 右 侧 的 “ 随 书 下 载 *"， 可 查看 图 18.1 
和 图 18.2 的 彩色 版 。 
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HotSpotVM 会 将 这 个 衰减 均值 作为 下 一 次 暂停 时 间 的 预测 值 。 以 代 
码 清 单 18.5 来 说 ， 预 测 值 就 是 40。 

在 历史 记录 的 数据 中 ， 数 据 越 旧 ， 就 越 与 最 新 数据 没有 什么 关系 。 
因此 ， 像 衰减 均值 那样 以 减少 过 去 数据 对 均值 影响 的 方法 来 求 平均 值 才 


是 最 合适 的 。 





18.1.3 “衰减 方差 
与 衰减 均值 类 似 的 还 有 衰减 方差 ( decaying variance )。 它 的 计算 方 
法 如 代码 清单 18.6 所 示 。 
代码 清单 18.6 ”衰减 方差 的 计算 方法 ( Ruby ) 





davg = 30 

dvar = 0 

qavoqE= 25 RE dev no 

Gyan = dav 0 0a 
davg = .40 0 dave -0 

von = (A000 ae: 2 0 a 0 
daveg = 4207000 daven :0 

Gwar = (2 cave :020 ea 0 
qavoE=s0E 0 ave os 

va SEE 
dvar.to i # => 44 





方差 是 表示 波动 与 基准 值 的 距离 的 值 。 本 例 中 的 基准 值 是 “添加 数 
据 时 的 所 有 历史 记录 的 衰减 均值 "。 豪 减 均值 是 预测 值 ( 即 预测 的 下 一 
次 数值 ) 也 就 是 说 ， 这 时 的 方差 表示 “当时 的 预测 值 与 当时 实际 的 值 
有 多 少 偏差 。 方 差 也 采用 求 衰 减 均 值 的 方法 ， 通 过 慢 慢 减 小 过 去 数值 
的 影响 来 进行 衰减 式 计算 。 

然后 ， 我 们 再 继续 算出 衰减 方差 的 平方 根 (代码 清单 18.7 )， 也 就 
是 衰减 标准 差 ( decaying standard deviation )。 











代码 清单 18.7 ”衰减 标准 差 的 计算 方法 ( Ruby ) 
Math,sqrt (dvar) .to i # => 6 
这 里 计算 出 的 衰减 标准 差 就 是 预测 值 与 实际 值 之 间 的 偏差 。 也 就 是 
说 ,这 里 可 以 预测 出 预测 值 与 实际 值 的 偏差 会 在 + 6 的 范围 内 。 
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18.1.4 包含 偏差 的 预测 
HotSpotVM 会 考虑 某 种 程度 的 偏差 ， 几 乎 每 次 都 会 计算 出 安全 的 预 

测 值 。 具 体 的 计算 方法 如 代码 清单 18.8 所 示 。 

代码 清单 18.8 ”安全 的 预测 值 


包含 偏差 的 预测 值 = 衰减 均值 + (可 信 度 /100 * 衰减 标准 差 ) 




















这 里 出 现 了 一 个 新 术语 : 可 信和 度 。 可 信和 度 表示 通过 衰减 标准 差 求 出 
来 的 波动 范围 的 可 信 程度 。 例 如 当 衰 减 标 准 差 的 值 是 6 时， 如 果 可 信和 度 
是 100%， 则 表示 将 偏差 范围 设置 在 +6 以 内 。 如 果 可 信和 度 为 50%， 则 
将 偏差 范围 设置 为 原 范 围 的 一 半 ， 即 +3 以 内 。HotSpotVM 中 可 信 度 的 
默认 值 为 50%， 不 过 程序 员 可 以 在 JVM 的 启动 选项 中 指定 它 。 

代码 清单 18.8 将 可 信和 范围 的 偏差 的 最 大 值 和 衰减 均值 ( 预测 值 ) 相 
加 ， 从 而 求 出 了 安全 的 预测 值 。 
代码 清单 18.9 HotSpotVM 根据 A 的 考试 成 绩 计算 的 预测 值 ( Ruby ) 


da (50/L1000 6 >.0 


如 果 以 A 的 考试 成 绩 为 例 ， 那 么 HotSpotVM 会 以 代码 清单 18.9 的 
方式 进行 计算 ， 并 做 出 “A 下 次 的 考试 成 绩 为 47 分 ”这 样 的 安全 预测 。 



























































ee 





注 : 关于 术语 

前 面 介 绍 的 衰减 均值 、 衰 减 方差 、 衰减 标准 差 等 术语 是 我 在 
HotSpotVM 的 源 代码 中 学 习 到 并 用 在 本 书 中 的 。 请 注意 它们 并 非常 用 的 
术语 。 




















18.1.5 ”历史 记录 的 实现 | 
下 面 我 们 来 看 一 看 实际 的 实现 。 如 下 所 示 ， 历 史记 录 保 存在 


G1CollectorpPolicy 的 成 员 变 量 中 。 





share/vm/gc implementation/g1/glCollectorPolicy .hpp 


86: class GlCollectorpolicy: public CollectorPolicy { 
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L150: meunecabtedsedt eoncurenta ma kn nme 
5d Eeuneabtedqdseqr leone en ma eemna nes ey 
SD TruncatedSeq* concurrent mark cleanup times ms; 





此 处 的 TruncatedSeg 就 是 存放 历史 记录 的 类 ， 它 继承 自 AbsSeqg 
类 。 下 面 是 用 于 添加 历史 记录 的 add () 成 员 函 数 。 























share/vm/utilities/mnumberSedq.cpp 


36: void AbsSeq::add(double val) { 


TIE 三 本 0 

EE _davg = val; 

41: ronTances = 

42:  } else { 

44: eavas = 0 el ev 

45: qoubles eite veal ave, 

46: ovarreance (uo lohan tentialpba cvarianee, 
AT8 

48: } 





_davg 和 _dvariance 分 别 表示 衰减 均值 和 衰减 方差 。_alpha 的 默 
认 值 是 0.7。 也 就 是 说 ， 这 里 进行 的 处 理 与 代码 清单 18.6 是 一 样 的 。 每 
次 添加 数据 到 历史 记录 时 ， 上 面 这 些 成 员 变 量 都 会 被 计算 1 次 。 

下 面 我 们 来 看 一 看 添加 数据 到 历史 记录 的 代码 。 举 个 例子 ， 并 发 标 
记 的 初期 标记 阶段 是 在 下 面 这 个 函数 中 添加 历史 记录 。 
































share/vm/gc implementation/g1/glCollectorPolicy.cpp 


954: void GlCollectorpolicy::record concurrent mark init end() { 








965550oubleendneinegsee os elanseomimel 
956: double elapsed time ms = 

(end time sec - mark init start sec) * 1000.0; 
957-0conceurrent markinititimes me >addl(elapseqdBt meame) 
961: } 

















第 956 行 代码 会 计算 初期 标记 阶段 的 暂停 时 间 ， 第 957 行 代码 会 将 
这 个 时 间 添 加 到 Truncatedseq 中 。 


18.1.6 _ 获取 预测 值 
下 面 我 们 来 看 一 看 获取 预测 值 的 处 理 。 作 为 例子 ， 下 面 给 出 了 计算 
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初期 标记 阶段 的 预测 值 的 成 员 函 数 。 


Share/vm/gc impLlementation/g1/glCcollectorPolicy.hpp 





536: double predict _ init time ms() { 
S53 return get new prediction( concurrent mark init times ms); 
SBE } 


第 537 行 代码 以 _concurrent _mark _ init times_ms 成 员 变量 为 





参数 调用 了 get_new_prediction() ， 这 个 函数 会 返回 预测 值 。 


get new prediction() 的 定义 如 下 所 示 。 





share/vm/gc implementation/g1/glCollectorPolicy .hpp 


342: double get new prediction (TruncatedSeq* sed) { 

343: return MAX2 (seq->davg() + sigma() * seq->dsd() 

344: Seq >davgl0 NN comesnmesEEacEOSULEESERUO 人 用 太 
3450 





MAX2 () 的 功能 是 比较 2 个 参数 ， 然 后 返回 较 大 的 值 。 第 344 行 的 处 








理 是 在 还 没有 充分 的 历史 记录 时 执行 的 ， 因 此 这 里 不 对 其 进行 说 明 ， 只 


讲解 第 343 行 的 处 理 。 











davg () 的 返回 值 是 衰减 均值 。s igma () 是 程序 员 设置 的 可 信 度 。 


dsd() 的 返回 值 是 衰减 标准 差 。 也 就 是 说 ， 这 段 处 理 计算 的 是 代码 清单 
18.8 中 展示 的 安全 预测 值 。 


目下 项 并 发 标记 的 调度 


下 面 ， 我 们 来 看 一 看 算法 篇 4.4 节 中 讲解 的 “调度 GC 的 暂停 时 机 ” 




















的 实现 方式 。 只 要 掌握 了 从 历史 记录 中 获取 预测 值 的 方法 ， 这 里 的 内 容 
就 非常 好 理解 了 。 





这 里 以 并 发 标记 暂停 处 理 中 的 最 终 标 记 阶 段 为 例 进行 讲解 。 





share/vm/gc implementation/gl/concurrentMarkThread.cpp 
93: void ConcurrentMarkThread::run() { 


号 double now = os::elapsedTime () ; 
L535 qeuble renarkaonredret ronnme.s 
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ga oey Pee emeenalk na 


154: Jlong sleep time ms = 
mmu tracker->when ms (now, remark prediction ms); 
TSS SSESsioleeplleunmeneathnnea SeegmSRR SSESS 下 


/* 最 终 标记 阶段 的 执行 */ 





(DE CMEehecrpointRooterinalClosure finaldcl (em 
166: spuneillverbose Ceeemanmk ne 

PB VMECCCIODeration op (stinallel verbosen etre) 
168: VMThread: :execute (&op); 


第 152 行 的 os::elapsedTime () 静态 成 员 也 数 会 返回 HotSpotVM 
启动 后 所 经 过 的 时 间 。 第 153 行 的 predict remark time ms () 会 获 
取 下 次 执行 的 最 终 标记 阶段 所 消耗 的 时 间 的 预测 值 。 这 个 值 会 被 传递 给 
when_ms () 成 员 函 数 。when_ms () 使 用 算法 篇 4.4 节 中 讲解 的 方法 返回 
we 接着 ， 这 个 值 被 传递 给 第 155 行 的 
os::sleep() 因数 ， 让 并 发 标记 线程 在 合适 的 暂停 时 机 到 来 之 前 暂停 
执行 。 

并 发 标记 中 的 其 他 暂停 处 理 也 是 使 用 上 面 这 样 的 方法 来 决定 执行 时 
机 的 。 


:习作 转移 的 调度 


正如 算法 篇 5.8 节 中 所 说 ， 转 移 的 执行 时 机 取决 于 新 生 代 区 域 的 数 
量 。 全 新 生 代 GC 的 计算 方法 非常 复杂 ， 因 此 这 里 只 介绍 比较 简单 的 部 
分 新 生 代 GC 的 转移 调度 。 

部 分 新 生 代 GC 中 ， 新 生 代 区 域 的 数量 上 限 值 必须 设 定 为 能 够 遵守 
GC 单位 时 间 范 围 内 的 尽量 小 的 值 ， 而 这 个 值 要 通过 下 面 这 个 成 员 郴 
设置 。 








| 























泛 











share/vm/gc _ implementation/g1/glCollectorPolicy.cpp 


503: void GilCollectorpolicy::calculate _ young list min length() { 


504:  _young list min length = 0; 
S05 
509: if ( alloc rate ms seq->num() > 3) { 


SO double now sec = os::elapsedTime(); 
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Sl: double when ms = mmu tracker 
>whendmax gcsec (nowB see) 0000; 

SD: deuble oleocnratenne Predretnablocnratennme( 
Ses Szedt mmrnegions > (siment) ee (alocnratenme :whenlmns)s 
514: Suzenmt curreatlreglonBnn ol youngallee ll >lengen( 
BT5 young liet mn length = mngreogionsEERREcUrcFenTE9TEnETUm7 
516: } 
s17: } 





先 将 HotSpotVM 启动 后 所 经 过 的 时 间 传 递 给 第 511 行 的 when_ 
max_gc_sec(), 计算 出 距离 下 次 可 暂停 时 机 的 时 间 。 第 512 行 的 
predict_alloc_rate_ms () 是 预测 下 次 “分 配 的 区 域 数 量 /经 过 的 时 
间 ” 这 个 比例 的 成 员 函 数 。 





share/vm/gc implementation/g1/glCollectorPolicy.hpp 


379: double predict alloc rate ms() { 
S00: EeeneasEgnswonsdneEncnEaCcEEaESEmEEESSW 
381: } 


alloc_rate_ms_seq 中 保存 着 “分 配 的 区 域 数量 / 经 过 的 时 间 ” 
这 个 比例 的 历史 记录 ， 它 会 通过 这 些 历 史记 录 求 出 下 一 次 的 预测 值 。 

然后 ， 第 513 行 代 码 会 将 计算 出 的 预测 值 与 距离 下 次 可 暂停 时 机 的 
时 间 相 乘 ， 计 算出 “到 下 次 可 和 暂停 时 机 附近 为 止 ， 能 够 分 配 的 区 域 的 数 
量 ” 的 预测 值 。 最 后 ， 第 515 行 会 将 这 个 值 与 现在 的 新 生 代 数量 上 限 相 
加 ， 得 到 用 于 部 分 新 生 代 GC 的 新 生 代 区 域 数 量 上 限 。 





























19 下 ea 








本 章 将 讲解 为 了 实现 准确 式 GC (exact GC )，HotSpotVM 是 如 何 将 
“准确 的 根 信息 ”提供 给 GC 算法 的 。 


为 了 实现 准确 式 GC，HotSpotVM 在 进行 GC 时 会 生成 “ 栈 图 ”。 
栈 图 表示 的 是 指向 VM 栈 内 所 有 对 象 的 指针 的 位 置 。 





19.1.1 ”基本 类 型 和 引用 类 型 的 变量 
Java 的 变量 类 型 有 int、float 等 基本 类 型 (代码 清单 19.1 第 1 
行 ) 在 Java 中 ， 基 本 类 型 是 作为 数值 处 理 的 。 在 C++ ( HotSpotVM ) 
中 ， 它 们 也 一 样 是 作为 int 或 float 等 数值 处 理 的 。 
除 此 之 外 ， 还 有 指向 object 类 (或 其 子 类 ) 的 实例 的 引用 类 型 
(代码 清单 19.1 第 2 行 ) 引用 类 型 在 C++ ( HotSpotVM ) 中 是 作为 指向 
对 象 的 指针 来 处 理 的 。 


代码 清单 19.1 基本 类 型 和 引用 类 型 


nt nae Ie // 基本 类 型 
2: Object referenceType = new Object(); // 引用 类 型 


















































这 里 的 问题 在 于 ， 基 本 类 型 在 VM 上 是 作为 数值 来 处 理 的 。 也 就 是 
说 ， 基 本 类 型 可 能 是 伪 指 针 。 因 此 ， 要 想 实 现 准确 式 GC，HotSpotVM 
必须 能 够 分 辨 出 基本 类 型 和 引用 类 型 。 
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19.1.2 ”HotSpotVM 的 栈 = 


在 讲解 如 何 分 辨 引用 类 型 之 前 ， 这 里 先 简单 介绍 一 下 HotSpotVM 
的 栈 。 

首先 ，HotSpotVM 基本 上 是 逐一 读 取 字 节 码 (byte code ) ( .class 文 
件 ) 内 的 命令 集 ， 然 后 再 根据 命令 进行 处 理 的 。 命 令 集 由 定义 了 所 执行 
操作 的 操作 码 (1 个 字 节 ) 和 操作 数组 成 。 操 作 码 实际 上 只 是 0x32 这 
样 的 字 节 序列 ， 但 是 这 样 的 形式 人 们 读 起 来 太 难受 ， 因 此 通常 我 们 会 以 
aaload 这 样 的 形式 来 表示 操作 码 。 这 种 形式 被 称 为 助 记 符 ( mnemonic )。 

如 图 19.1 所 示 ， 在 HotSpotVM 中 存在 JVM 栈 和 栈 帧 的 概念 。 它 们 
的 作用 分 别 与 C 语言 中 的 调用 栈 ( call stack ) 和 调用 帧 〈 call frame ) 相 
同 。 当 Java 上 的 方法 被 调用 时 ， 对 应 的 栈 帧 会 被 存储 在 JVM 栈 中 ， 然 
后 在 方法 执行 完成 后 ， 栈 帧 从 栈 中 弹出 。 











< 





















































JVM 栈 
图 19.1 JVM 栈 和 栈 帧 


此 外 ， 栈 帧 中 还 存放 有 局 部 变量 和 操作 数 栈 。 局 部 变量 用 来 存放 方 
法 内 要 使 用 的 局 部 变量 。 另 外 ， 方 法 参数 会 被 当 作 局 部 变量 处 理 。 

HotSpotVM 是 一 种 栈 式 虚拟 机 ( stack machine )， 所 以 VM 上 的 计 
算 都 是 使 用 栈 进行 处 理 的 。HotSpotVM 会 使 用 方法 帧 内 的 操作 数 栈 
进行 计算 。 
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19.1.3 ”HotSpotVM 的 执行 流程 





下 面 ,我 们 通过 实际 的 示例 代码 ( 代码 清单 19.2 ) 看 一 看 HotSpotVM 
是 如 何 使 用 局 部 变量 和 操作 数 栈 的 。 


代码 清单 19.2 TwoDifferentLocalVars.java 








1: class TwoDifferentLocalVars { 


名 
2 
4: 
5 
6 


3 


nt me 
Object referenceType = new Object(); // 引用 类 型 





= 1; 


public static void main(String args[]){ 
































代码 中 的 main () 方法 是 一 个 将 基本 类 型 和 引用 类 型 存储 在 局 部 变 
译 为 Java 字 节 码 后 ， 结 果 如 代码 清单 


量 中 的 简单 方法 。 将 这 个 方法 编 


19.3 所 示 。 




















代码 清单 19.3 TwoDifferentLocalVars.java 的 字 节 码 


BE onset 

Pe Ene 

pc( 2): new #2 // class java/lang/Object 

oe sp ohio 

pc( 6): invokespecial #1 // Method java/lang/Object."<init>" 
Bestoren 

Be (Lo et 


代码 清单 19.3 的 字 节 码 被 分 配 的 编号 并 不 是 代码 的 行 号 ， 而 是 分 配给 
方法 内 字 节 人 码 的 唯一 的 程序 计数 姻 ( program counter， 后 面 的 图 中 简称 
pc )。HotSpotVM 会 从 上 至 下 依次 执行 代码 清单 19.3 的 字 节 人 码 ， 在 局 部 变 


量 中 保存 基本 类 型 和 3 引 上 月 





类 型 的 值 。 字 节 码 乍 看 起 来 难以 理解 ,但 只 要 大 


致知 道 VM 的 执行 流程 和 命令 集 ， 就 会 发 现 其 实 也 没有 那么 难 ( 表 19.1 )。 
助 记 符 和 命令 的 含义 


表 19.1 






































iconst_'i! 将 相当 于 'i' 部 分 的 int 类 型 的 常量 添加 到 操作 数 栈 中 

istore_'n! 将 操作 数 栈 头 部 的 int 类 型 的 值 保存 到 局 部 变量 数组 的 第 'n' 
个 元 素 中 

new 创建 一 个 新 的 对 象 并 将 其 添加 到 操作 数 栈 中 











复 秆 





1 操 人 





F 数 栈 头 部 的 值 并 将 复制 出 的 值 添 加 到 操作 数 栈 中 
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( 续 ) 
助 记 符 命令 的 含义 
invokespecial | 调用 实例 的 初始 化 方法 等 特殊 方法 


















































astore_'n' 将 操作 数 栈 头 部 的 引用 类 型 的 值 保 存 到 局 部 变量 数组 的 第 'n' 
个 元 素 中 


























return 从 方法 中 返回 void 











表 19.1 中 列 出 了 代码 清单 19.3 中 出 现 的 助 记 符 及 其 命令 的 含义 。 
图 19.2 展示 了 字 节 码 的 执行 流程 。 








0 » 2 
局 部 变量 数组 String[] 
参数 1 (args ) 的 值 ( 对 象 的 地 址 ) 
操作 数 栈 
有 pc(0) : iconst 1 
局 部 变量 数组 [string[ 
操作 数 栈 1 
是 pe(1): istore 1 
局 部 变量 数组 [BeringU] TY [ 
操作 数 栈 

















有 pc(2) : enw 


局 部 变量 数组 [String[]| 1 
操作 数 栈 | cbject | 
生成 的 对 象 的 地 址 
用 pc(5) : dup 
局 部 变量 数组 [string0| 1 

操作 数 栈 | SPjese | opjeet ] 
是 pc(6) : invokespecial #1 
局 部 变量 数组 |String[]| 1 
操作 数 栈 
有 pc(9) : astore 2 
局 部 变量 数组 [Btring[t] ， 1 | opjece] 









































操作 数 栈 | 
用 pc(10) : return 
局 部 变量 数组 [string[ 1 | cbject 
操作 数 栈 | 


图 19.2” 字 节 码 的 执行 流程 
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最 终 ， 局 部 变量 1 中 存放 的 是 1， 局 部 变量 2 中 存放 的 是 object 
类 的 实例 的 地 址 。 局 部 变量 1 是 代码 清单 19.2 中 的 变量 primitiveType， 
局 部 变量 2 是 变量 referenceType。 

此 外 , 像 上 面 这 样 一 边 读 取 字 节 人 码 ， 一 边 逐 个 执行 命令 集 的 解释 器 
称 为 “ 字 节 人 码 解 释 器 ”。 

下 面 让 我 们 回 到 GC 的 主题 上 。 如 果 GC 在 pce10 的 状态 下 被 执行 ， 
那么 它 必须 能 够 判断 局 部 变量 2 所 引用 的 对 象 确 实 还 存活 着 ， 而 且 它 还 
必须 能 够 分 辨 出 局 部 变量 1 中 保存 的 基本 类 型 的 值 不 是 回收 目标 。 那 么 
HotSpotVM 是 如 何 分 辨 局 部 变量 数组 ( 或 是 操作 数 栈 ) 内 的 值 的 呢 ? 












































19.1.4 “什么 是 栈 图 


这 里 ， 我 们 要 关注 的 是 Java 的 类 型 信息 。 查 看 代码 清单 19.3 可 以 
知道 ， 对 于 基本 类 型 和 引用 类 型 ， 将 它们 的 值 保存 在 局 部 变量 数组 和 操 
作 数 栈 中 的 助 记 符 是 不 同 的 。 基 本 类 型 的 助 记 符 是 istore_1， 而 引用 
类 型 的 助 记 符 是 astore_2。 

HotSpotVM 利用 字 节 人 码 的 类 型 信息 ， 来 创建 发 生 GC 时 栈 帧 的 栈 
图 。 顾 名 思 义 ， 栈 图 就 是 表示 将 引用 类 型 保存 在 局 部 变量 数组 和 操作 数 
栈 上 什么 位 置 的 地 图 。 实 际 的 栈 图 是 以 00100 这 样 的 比特 序列 表示 的 。 
比特 序列 中 值 为 1 的 比特 ， 表 示 它 所 对 应 的 局 部 变量 ( 或 操作 数 ) 中 保 
存 的 是 引用 类 型 的 值 。 
































19.1.5 “抽象 解释 器 

栈 图 是 由 抽象 解释 器 创建 出 来 的 。 简 单 地 说 ， 抽 象 解释 器 就 是 只 记 
录 类 型 信息 的 解释 器 。 抽 象 解释 器 只 记录 保存 在 局 部 变量 数组 和 操作 数 
栈 中 的 值 的 类 型 ， 并 不 关心 实际 保存 的 值 。 

下 面 我 们 以 19.1.3 节 中 介绍 的 字 节 人 码 ( 代码 清单 19.3 ) 为 例 ,， 来 比 
较 一 下 抽象 解释 器 ( 代码 清单 19.4 ) 和 普通 解释 器 的 行为 。 
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代码 清单 19.4 TwoDifferentLocalVars.java : 字 节 码 的 执行 流程 ( 抽象 解释 器 ) 


BasicBlock#0 

pe(qo :localse = staces TEST 

全 下 下 二 Tocais= SEack sconcml 

Pe lo cal = EC // new ; 沟 
Bea Lec alse = ak Wd 

pc( 6): locals = 'rv ', stack = 'rr' // invokespecial #1 
Be locales = vtack /atorcn 

Ses Lace Ss Jw Gaels S A/ neturen 


抽象 解释 器 的 执行 流程 很 好 写 ， 如 上 所 示 。 代 码 清单 19.4 中 的 
locals 是 局 部 变量 数组 ，stack 是 操作 数 栈 。 请 将 局 部 变量 数组 或 操 
作 数 栈 中 的 r (reference ) 当 作 引 用 类 型 ， 把 v (value ) 当 作 基本 类 型 。 
局 部 变量 数组 内 的 半角 空格 表示 还 没有 被 初始 化 的 元 素 。 关 于 
BasicBlock#0 的 作用 ， 我 将 在 19.1.7 节 中 进行 讲解 ， 现 在 请 先 忽 略 它 。 

抽象 解释 器 会 记录 某 个 命令 集 被 执行 前 的 局 部 变量 数组 和 操作 数 栈 
的 类 型 信息 。 例 如 在 pc0 处 ， 它 会 记录 iconst_1 被 执行 前 的 类 型 信息 。 
因此 ， 局 部 变量 数组 ( locals ) 中 只 有 表示 参数 args 的 类 型 的 上 将 被 
记录 下 来 。 接 下 来 ， 在 pcl 处 执行 完 iconst_1 后 ， 操 作 数 栈 (stack ) 
中 表示 1 的 类 型 的 v 将 被 记录 下 来 。 

抽象 解释 器 就 是 像 这 样 毫 不 关心 实际 值 ， 只 记录 类 型 信息 的 。 接 
着 ，HotSpotVM 就 会 根据 抽象 解释 器 记录 下 的 对 应 了 一 次 字 节 码 执行 的 
类 型 信息 创建 栈 图 。 





















































__19.1.6 _ 栈 图 的 创建 

在 命令 集 执行 过 程 中 的 任何 时 刻 都 可 能 发 生 GC。 例 如 ， 在 创建 对 
象 的 命令 集 的 执行 过 程 中 可 能 会 发 生 GC， 在 进行 加 法 运算 的 命令 集 的 
执行 过 程 中 也 可 能 会 发 生 GC。 

如 果 在 某 个 命令 集 的 执行 过 程 中 发 生 了 GC, 那么 GC 必须 要 判断 
栈 帧 内 的 局 部 变量 数组 和 操作 数 栈 中 的 引用 型 变量 所 指向 的 对 象 是 否 还 
存活 着 。 为 此 ， 必 须要 创建 出 GC 发 生 时 的 命令 集 执行 时 的 栈 图 。 

这 里 我 们 以 代码 清单 19.4 中 pcs 的 命令 集 (aup 操作 码 ) 为 例 , 来 
看 一 看 在 执行 它 的 过 程 中 发 生 GC 时 ， 栈 图 是 如 何 被 创建 出 来 的 。 
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创建 出 的 栈 图 如 图 19.3 所 示 。 





be (二 Qup 





局 部 变量 数组 操作 数 本 
古国 大 帮 


栈 图 
图 19.3 ” 栈 图 的 创建 


从 图 中 我 们 可 以 看 到 ， 对 应 局 部 变量 数组 头 部 和 操作 数 栈 头 部 的 比 
特 位 为 1。GC 会 参考 这 份 栈 图 ， 做 出 “在 局 部 变量 数组 头 部 和 操作 数 
栈 头 部 保存 着 引用 类 型 的 值 ”的 判断 ， 进 而 判断 出 它们 所 指向 的 对 象 确 




















19.1.7 ”有 条 件 分 支 时 的 栈 图 


前 面 ， 我 们 以 没有 条 件 分 支 时 的 示例 代码 为 例 ， 看 了 栈 图 是 如 何 被 
创建 出 来 的 。 但 是 ， 实 际 上 只 要 有 一 个 条 件 分 支 ， 栈 图 的 创建 难度 就 会 
增加 一 级 。 请 看 一 看 下 面 代 码 清 单 19.5 中 的 这 段 示 例 代码 。 


代码 清单 19.5 TwoControlPath.java 























1: class TwoControlpath { 

2: static public void main(String args[]){ 
3: Lf (args lengtn on 

4: Obereterencen ee = nwoDeae 
Si Fetus 

6 } else { 

8 nel 

Bs returny 

9 } 

OE } 

aa 


代码 清单 19.5 中 的 代码 首先 会 根据 参数 args 的 长 度 来 设置 
referenceType 局 部 变量 的 值 或 primitiveType 的 值 。 
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其 中 的 main() 函数 的 字 节 码 如 代码 清单 19.6 所 示 。 


代码 清单 19.6 TwoControlPath.java : 字 节 码 


月 
peo aleacmo 
Be (arravienagen 
Be 2 -Ene 14 
Be 5 new #2 // class java/lang/Object 
Be ep: dup 
pce( 9): invokespecial #1 // Method java/lang/Object."<init>" 
pe .astorent 
Be (tte) eturn 
Be comseal 
这 SEE 
oo) eae 


代码 清单 19.6 中 出 现 了 一 个 新 的 助 记 符 ifne。ifne 指令 的 含义 是 
“将 操作 数 栈 头 部 的 int 类 型 的 值 取出 来 ， 如 果 它 不 是 0 则 跳 至 指定 的 
pc”。pc2 处 的 指令 是 ifne 14， 因 此 如 果 操 作 数 栈 头 部 的 值 (args . 
length ) 不 是 0， 则 程序 会 跳 转 至 pc14。 

接 下 来 ,， 希望 大 家 关注 一 下 pcl2 和 pcl5。 这 两 条 指令 的 意思 是 分 
别 将 基本 类 型 和 参照 类 型 的 值 保存 到 局 部 变量 1 中 。 也 就 是 说 ， 不 同 的 
条 件 分 支 下 局 部 变量 1 中 保存 的 值 不 同 。 如 果 在 pc13 处 发 生 GC， 那 么 
此 时 局 部 变量 1 的 类 型 是 引用 类 型 ， 而 如 果 在 pc16 处 发 生 GC， 那 么 此 
时 局 部 变量 1 的 类 型 就 是 基本 类 型 。 

因此 ， 抽 象 解释 器 必须 记录 所 有 情况 下 的 类 型 信息 。 也 就 是 说 ， 即 
使 代码 清单 19.5 中 args .1length 的 值 为 0， 抽 象 解释 器 也 必须 记录 另 
外 一 种 情况 下 的 类 型 信息 。 

这 时 ， 抽 象 解释 器 会 将 字 节 码 划 分 为 “基本 块 ”(basic block ) 单 
位 。 代 码 清单 19.6 中 的 字 节 码 就 会 被 划分 为 下 面 这 样 。 
代码 清单 19.7 TwoControlPath.java : 字 节 码 的 执行 流程 ( 抽象 解释 器 ) 


BasicBlock#0 
pe(o Locals 
Be Locals 






















































































'r ' stack wl Waloadd 
Stack // arraylength 


中 , 4 


| | | 
R 


Bel 2 leeae Ip" stack ww A lfmne la 
BasicBlock#2 
二 本 全) // new 


Be Localse = tars 
Be Uocals = esta 
Pel oloea = eae 
pel ecalse eee 
BasicBlock#1 

Be l(a0 Locale = "rstacks 
BolsvR Localse = utacks 
cel1i): lals Ss Tr Saas = 


Wr /A 
Lensl /AM/ 
Sa/ 
a Wh 
名 A 
0 
Ey Wd 
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dup 
invokespecial 
astornenl 

了 EUnSW 


oremie dl 
OE 
ECGUEn 


查看 代码 清单 19.7 可 知 ，if 语句 的 真 、 假 两 种 情况 的 字 节 人 码 被 分 
在 了 两 个 不 同 的 基本 块 (BasicBlock#1、BasicBlock#2) 中 。 
BasicBlock#1 的 pcl4 和 BasicBlock#2 的 pc5 的 局 部 变量 数组 及 操作 
数 栈 的 类 型 信息 是 BasicBlock#0 的 pc2 执 行 后 的 类 型 信息 。 
BasicBlock#2 会 执行 话语 句 为 “ 真 ”时 的 字 节 码 并 记录 类 型 信息 ， 而 





BasicBlock#1 记录 的 是 为 “ 假 ” 
此 外 ， 请 注意 代码 清单 19.7 中 pc13 和 pc16 处 的 局 部 变量 1 中 的 类 








的 类 型 信息 。 























型 信息 是 不 一 样 的 。 也 就 是 说 ， 即 使 是 在 pcl13 和 pc16 处 发 生 了 GC， 


GC 也 可 以 通过 栈 图 分 








有 了 “基础 块 ”机 
录 下 来 。 不 仅仅 是 条 件 

















分 支 时 会 














或 try-catch 语句 等 也 会 





和 出 局 部 变量 1 的 类 型 。 

出， 方法 内 的 各 种 情况 下 的 类 型 信息 就 都 可 以 被 记 
] 到 基础 块 ， 循 环 语句 、switch 语句 
到 基础 块 。 而 像 代码 清单 19.2 中 那样 ， 方 





法 内 没有 条 件 分 支 时 ， 方 法 内 的 所 有 字 节 码 都 会 被 当 作 BasicBlock#0 


处 理 。 


19.1.8 ”方法 调用 时 的 栈 图 














前 面 ， 我 们 看 了 栈 帧 执行 时 的 栈 图 是 如 何 被 创建 出 来 的 。 下 面 ， 我 
们 看 一 看 当 JVM 栈 中 累积 了 多 个 栈 帧 时 ， 栈 图 是 如 何 被 创建 出 来 的 


(图 19.4 )。 
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、 
的 栈 由 : … [| 
各 栈 帧 的 栈 图 
> 合成 在 一 起 形 
成 整体 的 栈 图 
用 栈 由 加 画面 
ps 








JVM 栈 


19.4 ”多 个 栈 帧 的 栈 图 的 创建 





我 们 来 看 一 看 方法 调用 时 的 栈 图 是 如 何 被 创建 出 来 的 。 请 看 代码 清 
单 19.8 的 示例 代码 。 


代码 清单 19.8 MethodCalljava 














1: class MethodCall { 

2 static public void main(String args[]){ 

3 Object referenceType = new Object (); 

4: me ne es 

5 geCalne ferencer ve rim ele 

Ge } 

Ts 

BE static void gcCall (Object a, int pb){ 

9: System.gc(); // 执行 GC 

TO: } 

Tig )} 

这 上段 代码 在 第 5 行 调用 了 gccall () 方法 ， 这 一 点 与 代码 清单 19.2 

不 同 。gccal1l () 方法 是 执行 GC 的 方法 。 虽然 它 在 代码 清单 19.8 中 接 

















收 了 一 个 引用 类 型 参数 和 一 个 基本 类 型 参数 ， 但 这 只 是 为 了 讲解 而 接收 
的 ， 实 际 上 我 们 并 不 会 用 到 这 两 个 参数 。 
代码 清单 19.8 的 main () 方法 的 字 节 码 如 下 所 示 。 


代码 清单 19.9 MethodCalljava : 字 节 码 


Peo constel 
BE stone 





: new 
wp 
: invokespecial #1 // Method java/lang/Object."<init>" 
SEO 
SEC lL 
aoaa 有 2 

: invokestatic 
hg 
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#2 // class java/lang/Object 


#3 // Method gcCall 


代码 清单 19.9 与 代码 清单 19.3 的 区 别 体 现在 pc10 至 pcl5 上 。 这 
一 段 是 调用 gccal1l () 方法 的 字 节 人 码 。pc10、pcll 将 gccall () 方法 参 
数 讨 人 操作 数 栈 中 ，pcl12 调用 gccall () 方法 。 

接 下 来 看 一 看 抽象 解释 器 对 代码 清单 19.9 的 解释 结 


代码 清单 19.10 ”MethodCall.java : 字 节 码 的 执行 流程 ( 抽象 解释 器 ) 














BasicBlock#0 
Peemo lecalse en eae Wconsel 
Sel de Moeela a We UU feel a Wy WY shelisel 
pe localss ve tacke = // new 
Be sy mocale = ve stack = /du 
Be locale ve ta = /nv ela 
Pe .Lecals va /Eo 
Peo Leealse = ac SELL 
Be ocala /lea 
pc(12): locals = 'rvr' stack = 'vr' // invokestatic 
aoc stacke = // return 

由 于 GC 会 发 生 在 gccall () 方法 内 ， 所 以 栈 图 会 在 程序 执行 到 代 








码 清单 19.10 的 pcl2 时 被 创建 出 来 。 
请 看 下 图 











19.5。 实 际 上 在 创建 方法 调用 方 的 栈 帧 的 栈 图 时 ， 传 递 给 


方法 参数 的 操 
作 数 栈 中 的 值 ， 





在 调 











就 可 以 根据 调 
作 数 栈 中 的 值 。 












































作 数 栈 中 的 值 会 被 忽略 。 这 是 因为 作为 参数 传递 过 去 的 操 
] 的 方法 中 会 被 作为 局 部 变量 处 理 。GC 利用 栈 图 
的 方法 栈 帧 中 的 局 部 变量 ， 来 正 胡 





地 分 辨 出 被 忽略 的 操 
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pc(12) : invokestatic 


局 部 变量 数组 操作 数 栈 








栈 图 


下 V 于 和 于 


[od 忽略 传递 给 方法 参数 
加 的 操作 数 栈 中 的 值 





19.5 ” 栈 图 的 创建 (方法 调用 时 ) 


19.1.9 已 编译 的 栈 帧 





JIT 在 将 方法 编译 为 机 器 语言 的 同时 也 会 创建 栈 图 。 对 于 已 编译 的 
方法 来 说 ， 栈 图 表示 的 是 在 某 栈 帧 内 的 什么 位 置 有 引用 类 型 ， 或 者 是 在 











哪个 寄存 器 中 有 引用 类 型 。 

















用 JIT 创建 栈 图 时 必须 格外 注意 创建 的 位 置 。 这 是 因为 每 执行 一 条 
机 器 语言 指令 ， 栈 和 寄存 器 的 状态 都 会 发 生变 化 。 因 此 理论 上 来 说 ，JIT 
必须 创建 对 应 各 条 指令 的 栈 图 。 不 过 ， 
所 以 基本 上 仅 会 在 以 下 情况 下 使 用 JIT 创建 栈 图 。 

















这 样 做 会 使 栈 图 变 得 非常 庞大 ， 





中 后 方 分 六 ( 例 : 在 循环 中 跳 转 至 后 面 ) 








@) 方法 调用 
(3) return 














(执行 可 能 会 发 生 异 常 的 指令 时 





以 上 这 些 情况 都 相当 于 15.3 节 





FP 讲 


F 解 的 安全 点 。 如 果 需 要 执行 GC 


时 不 在 以 上 这 些 时 间 点 ， 那 么 需要 先 让 人 处理 前 进 或 后 退 到 这 些 时 间 点 上 


才能 执行 。 





在 HotSpotVM 中 调用 已 编译 的 方法 时 ,“ 已 编译 的 栈 帧 ”会 被 存储 





在 JVM 的 栈 中 (参考 图 19.6 )。 
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已 编译 的 栈 帧 1| olo [。 
发 生 GC 时 的 栈 图 
已 编译 的 栈 帧 到 圆 贺 0|1 二 
方法 调用 时 的 栈 图 
栈 帧 —|—» 1| 1|0 [ 医 
通过 抽象 解释 器 创建 


















































JVM 栈 
图 19.6 已 编译 的 栈 帧 








于 编译 后 的 栈 帧 一 定 带 有 发 生 GC 时 的 栈 图 ， 所 以 它 会 将 自 带 的 
栈 图 与 抽象 解释 器 创建 出 的 其 他 栈 图 合成 在 一 起 ， 作 为 根 信息 提供 给 
GC 算法 。 

这 里 令 我 稍微 感到 疑惑 的 是 :“JIT 在 编译 时 就 会 确定 栈 图 吗 ?” 不 
过 细 细 思考 后 我 明白 了 ，JIT 可 以 从 Java 的 助 记 符 的 类 型 信息 中 获知 引 
用 类 型 的 值 ， 而 且 它 自己 也 有 将 字 节 码 编译 为 机 器 语言 的 编译 器 ， 可 以 
完全 控制 栈 和 寄存 器 的 使 用 方法 ， 因 此 在 编译 时 确定 栈 图 也 不 是 什么 不 
可 思议 的 事情 。 


下 忆 放 句柄 区 域 与 句柄 标记 


前 面 ， 我 们 看 到 的 都 是 开发 人 员 为 了 能 够 对 JVM 栈 进行 准确 式 GC 
而 做 的 努力 。 现 在 ， 我们 来 看 一 看 开发 人 员 在 原生 ( C++ 的 ) 调用 栈 上 
下 了 哪些 功夫 。 

HotSpotVM 使 用 句柄 区 域 (handle area ) 和 句柄 标记 ( handle mark ) 
来 管理 指向 调用 栈 内 的 对 象 的 指针 。 这 种 做 法 与 V8 的 做 法 十 分 相似 。 由 
于 V8 的 开发 参考 了 HotSpotVM， 因 此 确切 地 说 是 V8 模仿 了 HotSpotVM。 

代码 清单 19.11 是 仅 创建 句柄 的 示例 代码 。 
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代码 清单 19.11 句柄 的 创建 
1: void make handles (oop obj1l, oop obj2) { 
2 : Handle hl(objl); // 创建 句柄 1 
3: Handle h2 (obj2); // 创建 句柄 2 
4: } 
HotSpotVM 的 句柄 分 配 在 各 个 线程 的 “句柄 区 域 ” 中 。 因 此 ， 代 人 码 
清单 19.11 中 创建 出 的 句柄 的 分 配 情况 如 图 19.7 所 示 。 
句柄 区 域 避 
hl|h2 


句柄 被 存储 在 句柄 区 域 中 。 make_handles() 结束 









































19.7 make_handles() 的 执行 示意 图 











如 果 只 是 这 样 ， 那 么 句柄 将 一 直 处 于 被 分 配 的 状态 。 因 此 
HotSpotVM 还 有 一 个 与 句柄 作用 域 (handle scope ) 几乎 相同 的 功能 ， 
称 为 “句柄 标记 ”。 

代码 清单 19.12 是 在 代码 清单 19.11 的 基础 上 添加 了 句柄 标记 的 代码 。 


代码 清单 19.12 ”句柄 的 创建 : 带 句 柄 标记 


1: void make _handles (oop obj1l, oop obj2) { 
2 HandleMark hm; 

Handle hl (obj1); 

Handle nol(obDe 


【5 心 ww 


Eb 

第 2 行 的 HandleMark 类 会 在 构造 函数 中 标记 ( 记录 ) 句柄 区 域 的 
头 部 。 然 后 在 析 构 函数 中 ，HandleMark 类 会 将 区 域 头 部 移动 到 之 前 标 
记 的 位 置 。 

图 19.8 是 代码 清单 19.12 的 执行 示意 图 。 



























































句柄 区 域 句柄 区 域 
hl [52 | 
t make_handles () 结束 
hm top top 在 句柄 标记 被 释放 时 ， 将 句 
在 创建 出 句柄 标记 时 ， 柄 区 域 的 头 部 移动 至 之 前 标 
标记 出 句柄 区 域 的 头 部 记 的 位 置 


19.8 make_handles() 的 执行 示意 图 : 带 句 柄 标记 
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不 过 ，HotSpotVM 的 实现 方针 是 尽量 多 地 用 Java 语言 来 实现 功能 ， 
因此 以 上 这 些 功能 几乎 没有 被 用 到 的 机 会 。 


/非常 抱歉 改 
， 刚才 弄 错 
上 了， 给 您 的 1 
! 是 普通 的 咖 1 
4 啡 。 这 才 是 ， 
\ 您 要 的 蓝 山 





20 有 下 1 





终于 来 到 本 书 的 最 后 一 章 了 。 本 章 将 稍微 改变 一 下 视角 ， 研 究 一 下 
HotSpotVM 中 写 屏障 的 性 能 开销 。 








由 顺 上 运行 时 切换 GC 算法 


正如 前 面 几 章 提 到 过 的 那样 ， 我 们 能 够 在 HotSpotVM 中 选择 多 种 
GC 算法 。 而 且 ， 由 于 是 在 JVM 的 启动 选项 中 指定 GC 算法 ， 所 以 GC 
算法 的 切换 必须 在 Java 程序 运行 时 ( 即 动态 地 ) 进行 。 
































20.1.1 ”性 能 下 降 的 担忧 

除了 在 程序 运行 时 切换 GC 算法 ， 还 有 一 种 办 法 是 在 编译 时 切换 

GC 算法。 也 就 是 说 ,我 们 可 以 编译 一 份 使 用 G1GC 的 OpenJDK 和 一 份 

使 用 CMS ( Concurrent Mark-Sweep， 并 发 标记 一 清除 ) 的 OpenJDK， 
以 此 构建 并 分 发 对 应 各 种 GC 算法 的 二 进 制 文件 。 

不 过 ， 采 用 这 种 方法 后 ， 每 增加 一 种 GC 算法 ，OpenJDK 的 开发 人 
员 都 需要 构建 并 发 布 一 份 新 的 二 进 制 文件 。 可 以 想象 ， 需 要 管理 的 二 进 
制 文件 会 越 来 越 多 ， 需 要 花费 的 时 间 也 会 越 来 越 多 。 此 外 ， 从 Java 程序 
员 的 角度 来 考虑 这 么 做 也 不 太 方 便 ， 因 为 他 们 还 是 希望 能 够 在 运行 时 切 
换 GC 算法， 以便 进 行 各 种 尝试 和 比较 。 
虽然 在 运行 时 切换 GC 算法 的 优点 显而易见 ， 但 是 与 在 编译 时 切换 
GC 算法 相 比 ， 它 的 性 能 还 是 有 所 下 降 。 下 面 我 们 来 看 一 段 具体 的 示例 
代码 ， 即 如 下 所 示 的 用 C 语言 编写 的 执行 GC 的 gc_start () 函数 。 





































































































20.1 ”运行 时 切换 GC 算法 


代码 清单 20.1 示例 : 在 运行 时 切换 GC 算法 的 启动 GC 的 函数 
void 
gc start (gc state state) { 
switch (state) { 

case gerstatenolee, 
gigcagcas tart 
break; 

Case gc state cms; 
emsBocnsbeanele 
break; 

case goneatensermal, 
SEN ge SE); 
break; 


代码 清单 20.2 示例 : 在 编译 时 切换 GC 算法 的 启动 GC 的 函数 
void 
gc _ start (void) { 
#ifdef GC STATE G1GC 
eee Cle aas) 
#elif GC STATE CMS 
cms gc start(); 
#elif GC STATE SERIAL 
sexmraloc stoman 
#endif 


bi 
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代码 清单 20.1 中 的 gc_start () 函数 中 有 一 段 条 件 分 支 处 天 














E， 而 代 


但 清单 20.2 则 是 在 编译 时 就 选择 了 gc_start () 内 要 调用 的 函数 ， 因 此 























在 运行 时 不 需要 分 文 处 理 。 





20.1.2 “ 写 屏 障 的 性 能 开销 增加 

















在 运行 时 切换 GC 算法 ， 最 有 可 能 出 现 性 能 下 降 的 地 方 是 写 屏 障 。 





写 屏 障 是 一 项 会 被 频繁 执行 的 处 理 ， 它 很 容易 成 为 性 能 瓶颈 。 











在 切换 


GC 算法 时 ， 如 果 这 些 GC 算法 需要 不 同 的 写 屏 障 ， 那 么 写 屏 障 也 会 发 
生 切 换 。 也 就 是 说 ， 代 码 清单 20.1 中 根据 条 件 分 支 切换 GC 算法 的 做 法 




















需要 发 生 在 写 屏 障 内 。 因 此 ， 这 会 增加 写 屏障 的 性 能 开销 ， 影 响 
的 速度 。 





mutator 
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ZI 忆 放 解释 器 的 写 屏障 


下 面 ， 我 们 来 看 一 看 HotSpotVM 是 如 何 实现 根据 GC 算法 切换 写 屏 
障 的 。 首 先 来 看 一 看 不 利用 JIT 编译 器 而 直接 执行 Java 字 节 码 的 解释 器 
中 的 写 屏 障 。 





















































20.2.1 _ 写 屏障 的 切换 
oop_store () 函数 会 将 引用 类 型 的 值 存储 在 对 象 字 段 中 。 





share/vm/oops/oop.inline.hpp 


518: template <class T> inline void oop store(volatile T* p, oop v) { 
SO: Waa [oe (ee Iosel (Ie) wp 





Sie oopDesc::release encode store heap oop(p, Vv); 
522: update barrier set((void*)p, v); 
3 } 


第 521 行 代 码 会 将 值 存储 在 字段 中 。 第 519 行 的 update barrier_ 
set_pre () 函数 是 在 字段 中 还 没有 设置 值 的 写 屏障 ， 第 522 行 的 update_ 
barrier_set () 函数 是 设置 好 值 的 写 屏障 。 

















share/vm/oops/oop.inline.hpp 


499: inline void update barrier set (void* p, oop v) { 

SONopDese be Sw tel (oe 

S02 

SO3: 

Od templater clare vn atenar rime 
To vl 

S05 QoBDesc oS we etme ne 

506: } 





如 上 所 示 ， 这 两 个 函数 只 是 对 通过 oopDesc: :bs () 获取 的 实例 调 
用 函数 而 已 。 这 里 oopDesc: :bs () 获取 的 是 通过 SharedHeap 类 的 
set_bartier_set() 成 员 函 数 设 置 的 实例 。 





share/vm/memory/sharedHeap .cpp 


273: void SharedHeap::set barrier set (BarrierSet* bs) { 
rr et De 
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276: oopDesc::set bs(bs); 
2 


set_barrier_set () 会 在 各 个 VM 堆 类 的 初始 化 时 被 调用 。 如 果 使 
的 GC 算法 是 G1GC， 那 么 被 作为 参数 传递 给 set_barrier_set () 
的 会 是 G1SATBCardTableLoggingModRefBS 类 的 实例 ; 而 如 果 使 用 的 
是 其 他 GC 算法， 则 会 是 cardTableModRefBSForCTRS 类 的 实例 。 
G1SATBCardTableLoggingModRefBS 和 CardTableModRefBSForCTRS 
都 是 BarrierSet 类 的 子 类 。 

下 面 ， 我 们 来 看 一 看 BarrietrSet 的 write ref field pre() 和 
write _tef field() 函数 的 定义 。 






































share/vm/memory/barrierSet.inline.hpp 


BE Eemplates ae von eanlen Se ibe et 
T* field, oop new val) { 
36: if (kind() == CardTableModRef) { 
B/E WlCaramableMeodRerBsr has Sim neemw ienere troldel 
Fe ncewaa, 





38:  } else { 


S08 Wet ee tne lo mw on ke ne wa 

Awa 

ae 

42: 

43: void BarrierSet::write ref field(void* field, oop new val) { 

44: if (kind() == CardTableModRef) { 

45: NearaqrableMoaReteo Eh mm we teetE nll 
FEM mne wv ay 

46: } else { 

A Weiteret El wen (Elela ew 

48: } 

49: } 














从 上 面 的 代码 中 可 以 看 到 ， 这 两 个 成 员 函 数 中 都 有 分 支 处 理 。 如 
第 36 行 和 第 44 行 的 kind() 是 cardTableModRef ， 那 么 它 会 判断 当前 
实例 自身 是 cardTableModRefBSForCTRS 的 实例 ， 然 后 调用 对 应 的 函 
数 ; 否则 ， 它 将 调用 write ref field( pre) work() 函数 。 








share/vm/memory/barrierSet .hpp 


9 wt uel one we te nee tl workal G0 telc, 
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oop new val) {}; 
NW 
106: virtual void write ref field work(void* field, oop new val) = 0; 
尽管 这 两 个 函数 在 Barrierset 类 中 被 定义 为 了 虚 函 数 ， 但 目前 被 
实现 的 只 有 G1SATBCardTableLoggingModRefBS 类 。 也 就 是 说 ， 目 前 
HotSpotVM 的 写 屏障 只 有 两 种 ， 它 们 会 在 执行 G1GC 与 其 他 GC 算法 时 
切换 工作 。 








20.2.2 ”在 G1GC 加 入 前 ， 写 屏障 只 有 一 种 


经 过 一 番 调 查 后 我 惊讶 地 发 现 , 在 G1GC 加 入 前 ( 即 OpenJDK 7 
之 前 ) 是 没有 运行 时 写 屏障 切换 的 。 那 时 ，HotSpotVM 中 只 实现 了 “记录 
卡 表 被 改写 ”这 么 一 个 简单 功能 ( 只 有 cardTableModRefBSForCTRS )。 
不 过 仔细 一 想 就 会 发 现 ， 其 实 分 代 GC 和 增 量 GC 只 要 有 这 个 功能 就 可 
以 了 。 之 后 加 入 新 的 写 屏障 不 过 是 因为 G1GC 的 写 屏障 太 过 特殊 了 。 

由 于 自 OpenJDK 7 引入 G1GC 后 ， 写 屏障 切换 也 随 之 发 生 ， 因 此 
解释 器 给 对 象 赋值 的 操作 的 性 能 稍微 有 所 下 降 。 


忆 I 玉 对 JIT 编译 器 的 写 屏障 


HotSpotVM 的 一 大 特点 是 会 对 超过 一 定 调用 次 数 的 方法 采用 JIT 编 
译 。 如 果 在 方法 内 有 给 对 象 字段 赋值 的 操作 ， 那 么 写 屏障 也 会 一 并 被 编 
译 为 机 器 代码 。 

前 面 讲 到 在 运行 时 切换 写 屏 障 会 出 现 条 件 分 支 处 理 ， 进 而 带 来 性 能 
开销 ， 而 如 果 牵 扯 到 JIT 编译 器 ， 情 况 又 会 有 所 不 同 。 





















































20.3.1 C1 编译 器 


JIT 编译 器 有 C1 、C2 和 Shark 三 种 。 本 书 只 讲解 C1 编译 器 。 

C1 是 客户 端 经 常用 到 的 JIT 编译 器 。 我 们 只 要 在 Java 的 启动 选项 
中 指定 -client 就 可 以 使 用 它 。 由 于 它 常 被 用 在 客户 端 ， 所 以 尽管 具有 
编译 时 间 相 对 较 短 、 内 存 使 用 量 较 少 等 优点 ， 但 同时 也 有 自身 的 缺点 ， 
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比如 基本 没有 对 处 理 进行 最 优化 。 





20.3.2 ”生成 写 屏 障 的 机 器 代码 


负责 对 对 象 字 段 的 赋值 操作 进行 JIT 编译 的 是 LTRGenerateor 类 
的 do_StoreField() 成 员 函 数 。 











share/vm/c1l/c1 LIRGenerator.cpp 








1638: void LIRGenerator::do StoreField(StoreField* x) { 
moa le (eaad) | 
2a bo Pre barrier (LiRDOpreact: :addrese(addrese) 
lal EOPP Bac :lecalOp /em va 
Ds true /* do load*/, 
I needs patching, 
ds (info ? new CodeEmitInfo(info) : NULL)); 
vate 
5 
laa if (is volatile && !needs patching) { 
la: volaeiesrielan onel(lvaL ue eu de nto 
1719:  } else { 
OR LIR PatchCode pateh code = 
neecdempatehmae uae nnonmal matehnonen, 
ls torelvaluenres a ads nioe pate 
1 
el 
Troe a (CS easy | 
Al espareneoecEeesUl val ums 
2 | 





第 1717 行 至 第 1722 行 会 生成 对 象 字段 赋值 操作 的 机 融 代 码 。 写 屏 
障 的 创建 是 在 pre_barrier() 和 post barrier() 函数 中 进行 的 。 


share/vm/c1l/c1 LIRGenerator.cpp 


S86 vend neenerat or Dre armlerl 

UERIOPE adadrnoDe ERO eenvaly 

1387: bool do load, bool patch, CodeEmitInfo* info) { 
1389: switch ( bs->kind()) { 





了 EEEE Beame Se Elm 
有 25 case BarrierSet::G1SATBCTLogging: 
1398. G1SATBCardTableModRef pre barrier!( 


adqgriopr prenval domload patehpe nfo 
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1394 : break; 

TG case BarrierSet::CardTableModRef: 
TE: case BarrierSet::CardTableExtension: 
1398: // No pre barriers 

1399 : break; 

1400: case BarrierSet::ModRef: 

1401: case BarrierSet::O0ther: 

1402: // No pre barriers 

1403: break; 

1404: default 

1405: ShouldNotReachHere () ; 

1406 : 

Ta07 让 

1408: } 





第 1389 行 出 现 的 kind() 和 20.2 节 中 讲解 的 kind() 相同 。 如 果 采 
用 的 是 G1GC， 程 序 就 会 进入 第 1393 行 中 的 case 语句 块 ， 生 成 用 来 创 
建 GlGC 的 写 屏 障 的 机 器 代码 ， 否 则 它 不 会 生成 任何 写 屏 障 。 第 1400 
行 至 第 1403 行 代码 中 的 case 语句 块 永远 不 会 被 执行 ， 因 此 我 们 可 以 忽 








略 它们 。 























下 面 我 们 来 看 一 看 post_barrier() 函数 的 实现 。 











Share/vm/cl/c1 LIRGenerator.cpp 


1410: void LIRGenerator::post barrier( 


LIR OprDesc* addr, LIR OprDesc* new val) { 


1411: switch ( bs->kind()) { 


1413: case BarrierSet::G1SATBCT: 

1414: case BarrierSet::G1SATBCTLogging: 

1415: Gl1SATBCardTableModRef post barrier(addr, new val); 
1416: break; 

1418: case BarrierSet::CardTableModRef: 

1419: case BarrierSet::CardTableExtension: 

1420: CardTableModRef post barrier(laddr, new val); 
1421: break; 

1422: case BarrierSet::ModRef: 

1423: case BarrierSet::Other: 

1424: // No post barriers 

1425: break; 

1426: default 


1427: ShouldNotReachHere () ; 
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1428 : } 
1429: } 

此 处 也 一 样 ， 根 据 kina () 的 值 来 决定 创建 什么 样 的 写 屏 障 。 如 果 
是 GIGC， 第 1415 行 代码 就 会 生成 用 于 G1GC 的 写 屏 障 ; 否则 第 1420 
行 代 码 会 生成 用 来 记录 “ 卡 表 被 修改 ”的 写 屏 障 。 第 1422 行 至 第 1424 
行 代 码 的 case 语句 块 永远 不 会 被 执行 ， 因 此 我 们 可 以 忽略 它们 。 

像 这 样 ， 要 使 用 的 GC 算法 在 进行 IT 编译 时 就 已 经 确定 了 ， 所 以 
才能 够 生成 对 应 的 写 屏障 。 因 此 ， 被 JIT 编译 器 编译 出 来 的 代码 在 切换 
写 屏障 时 没有 任何 性 能 开销 。 

JIT 编译 器 真是 太 好 了 ! 


















































阅读 源码 的 感想 

我 在 阅读 OpenJDK 的 源 代码 时 发 现 有 一 些 不 好 理解 的 地 方 。 
首先 是 回调 “地 狱 " 。 调 用 通过 函数 参数 得 到 的 对 象 实例 的 函数 ， 然 
后 再 调用 通过 刚才 调用 的 那个 函数 参数 得 到 的 对 象 实例 的 函数 ， 然 后 再 次 
进行 这 样 的 函数 调用 …… 这 样 的 代码 真 让 人 受 不 了 。 

接着 是 继承 “地 狱 "。 很 多 类 具有 四 五 层 继承 关系 ， 让 人 在 阅读 代码 
时 非常 困惑 。 而 且 由 于 某 些 历史 原因 ， 类 划分 的 粒度 也 乱七八糟 ， 缺 少 统 
一 性 。 如 果 统 一 性 好 一 点 ， 也 许 会 更 容易 理解 。 

话 虽 如 此 ，OpenJDK 的 源 代码 现在 仍 处 于 开发 阶段 ， 功 能 还 在 不 断 
地 扩展 和 完善 ， 所 以 抽象 化 设计 做 得 非常 好 。VM 和 操作 系统 之 间 的 抽象 
化 非常 实用 ，GC 算法 的 添加 也 非常 容易 。 熟 悉 它 之 后 ， 开 发 者 就 会 发 现 
它 非常 容易 修改 ， 让 人 有 一 种 这 就 是 “我 们 的 VM” 的 感觉 。 

得 益 于 各 位 开发 者 编写 出 的 OpenJDK， 我 一 边 抱 怨 又 一 边 非常 享受 
地 读 完了 它 的 源 代码 。 感 谢 你 们 编写 出 这 种 让 人 能 够 如 此 享受 地 阅读 的 代 
码 ( 绝 无 讽 刺 之 意 )。 
















































































































































































写 在 算法 篇 完成 之 后 


在 “GC 书 ” 的 原稿 中 ， 有 一 章 是 关于 “HotSpotVM 的 实现 ”。 虽 
然 当 时 已 经 写 了 一 半 (40 页 )， 但 由 于 时 间 关 系 没 能 出 版 。 我 心 想 好 不 
容易 写 了 这 么 多 ， 就 向 日 本 达 人 出 版 社 咨询 能 否 出 版 。 于 是 ， 就 有 了 这 
本 书 。 

一 开始 我 计划 只 介绍 G1GC 的 实现 ,但 是 在 写作 过 程 中 我 渐渐 改变 
了 想法 ， 觉 得 还 是 先 写 一 些 算法 原理 更 有 助 于 读者 理解 ， 这 就 是 本 书 算 
法 篇 的 写作 契机 。 所 以 ， 算 法 篇 其 实 是 我 从 零 开 始 写 的 。 

就 这 样 每 天 坚持 写 一 点 ， 我 终于 写 完了 这 本 书 。 很 高 兴 它 能 够 出 现 
在 各 位 读者 的 手中 。 

最 近 ， 我 经 常 在 电视 或 网 上 看 到 一 些 关于 核电 站 的 新 闻 。 这 让 我 总 
是 不 由 自主 地 联想 到 GC。 

在 日 常生 活 中 ， 我 们 通常 意识 不 到 核电 站 的 存在 。 但是， 我 们 用 到 
的 一 部 分 电力 其 实 正 是 由 核电 站 来 供应 的 。 然 而 , 一旦 核电 站 出 现 问 
题 ， 人 们 就 会 认为 是 核电 站 这 个 存在 的 “不 好 ”。 

在 编程 的 时 候 ， 我 们 通常 意识 不 到 GC 的 存在 。 但 是 ， 我 们 之 所 以 

能 够 随意 地 创建 对 象 ， 其 实 正 是 GC 的 功劳 。 然 而 ,一 旦 应 用 程序 因为 
GC 而 出 现 了 一 点 问题 ， 有 些 开 发 人 员 就 会 武断 地 认为 GC 很 烦人 。 

在 这 里 ， 我 想 说 的 并 不 是 “我 们 应 该 时 刻 对 GC 心 存 感激 "。 其 实 
GC 带 来 的 问题 ， 对 于 深入 研究 它 的 人 来 说 是 很 有 趣 的 。 

发 生 问题 时 感到 厌烦 是 难免 的 ， 但 是 对 于 GC 的 研究 者 来 说 ， 这 时 
应 该 做 的 就 是 努力 解决 问题 。 而 且 ， 解 决 问题 的 过 程 才 是 最 有 趣 的 。 

我 认为 ，GC 的 魅力 就 在 于 这 些 “ 问 题 ”。 和 希望 我 们 可 以 不 断 地 解决 
各 种 问题 ， 做 出 更 好 的 东西 。 
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好 了 ， 加 妹 叫 了 这 么 多 很 抱 菊 ， 我 们 对 G1GC 算法 的 学 习 就 到 此 
结束 吧 。 接 下 来 ， 让 我 们 一 起 迎接 新 的 GC 问题 ! 








中 村 成 洋 
2011 年 4 月 16 日 


致 想 要 深入 研究 GC 的 读者 

这 里 我 想 给 阅读 完 本 书后 还 想 要 深入 研究 GC 的 读者 ,或 是 想 要 深 
入 研究 HotSpotVM 的 读者 推荐 一 些 我 阅读 过 的 图 书 、 论 文 和 文章 。 
首先 ， 给 想 学 习 HotSpotVM 中 其 他 GC 算法 的 读者 推荐 下 面 这 篇 论 
文 。 它 讲 的 是 被 称 为 CMS ( 也 称 为 并 发 低 暂 停 回 收费 ) 的 GC 算法 。 





















































® Tony Pnntezis, David Detlefs. A Generational Mostly-concurrent 


Garbage Collector [D]. ISMM 2000. 


另外 ， 如 果 想 学 习 ParallelGC， 那 么 我 建议 读者 阅读 我 在 第 16 章 的 专 
栏 中 讲 过 的 “工作 窃取 ”。 学 习 了 上 面 这 些 内 容 后 ， 在 阅读 HotSpotVM 
的 源 代码 时 碰 到 这 些 内 容 就 非常 容易 理解 了 。 

我 自己 在 学 习 HotSpotVM 的 源码 时 还 不 太 了 解 Java 虚拟 机 的 规范 ， 
所 以 非常 费劲 。 具 体 来 说 ， 我 当时 不 太 理 解 栈 图 相关 的 内 容 。 那 时 ， 我 
阅读 了 下 面 这 本 有 关 Java 虚拟 机 规范 的 书 。 这 本 书写 得 非常 好 ， 给 了 我 
莫大 的 帮助 。 而 且 ， 它 的 内 容 还 非常 有 意思 。 

















e Tim London, 等 . Java 虚 拟 机 规范 (Java SE 8 版 ) [M]. 爱 飞翔 , 等 
译 . 北京 : 机 械 工业 出 版 社 , 2015. 


至 于 JIT， 老 实说 ， 即 使 阅读 了 HotSpotVM 的 源 代码 ， 我 也 没 搞 
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懂 。 因 此 ， 我 先 阅 读 了 下 面 的 文章 ， 之 后 才 开始 阅读 源 代 码 。 


e 售 树 坂 顶 . OpenJDK Internals 1.0 documentaion. 2011. (日语) 


























男 外 ， 我 还 参考 了 下 面 这 篇 论文 中 有 关 JIT 和 栈 图 (论文 中 称 为 
oop map ) 的 创建 时 机 ， 以 及 安全 点 的 内 容 。 


e@ Thomas Kotzmann, et al. David CoxDesign of the Java HotSpotVM 
Client Compiler for Java 6[D]. TACO, 2008: 5(1-7). 





如 果 感 兴趣 ， 请 一 边 参 考 上 面 的 资料 ， 一 边 “ 哺 ”HotSpotVM 的 源 
代码 吧 。 
我 们 有 缘 再 会 ! 





























中 村 成 洋 
2012 年 5 月 13 日 
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